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本 书 是 经 典 的 计算 机 网 络 教材 ， 采 用 作者 独创 的 自 顶 向 下 方法 来 讲授 计算 机 网 络 的 原理 及 其 协议 ， 
自 第 1 版 出 版 以 来 已 经 被 数 百 所 大 学 和 学 院 选 作 教材 ， 被 译 为 14 种 语言 。 

第 7 版 保持 了 以 前 版 本 的 特色 ， 继 续 关 注 因 特 网 和 计算 机 网 络 的 现代 处 理 方式 ， 注 重 原理 和 实践 ， 
为 计算 机 网 络 教学 提供 一 种 新 颖 和 与 时 俱 进 的 方法 。 同 时 ， 第 7 版 进行 了 相当 多 的 修订 和 更 新 ， 首 次 
改变 了 各 章 的 组 织 结构 ， 将 网 络 层 分 成 两 章 (第 4 章 关 注 网 络 层 的 数据 平面 ， 第 5 章 关 注 网 络 层 的 控制 
平面 )， 并 将 网 络 管理 主题 放 人 新 的 第 5 章 中 。 此 外 ， 为 了 反映 上 自 第 6 版 以 来 计算 机 网 络 领 域 的 新 变化 ， 
对 其 他 章节 也 进行 了 更 新 ， 删 除了 -FTP 和 分 布 式 散 列 表 的 材料 ， 用 流行 的 因特网 显 式 拥塞 通告 (ECN ) 
材料 代替 了 ATM 网 络 的 材料 ， 更 新 了 有 关 802.11 ( 即 WiFi) 网 络 和 蜂窝 网 络 (包括 4G 和 LTE) 的 
材料 ， 全 面 修订 并 增加 了 新 的 课 后 习题 ， 等 等 。 

本 书 适 合作 为 计算 机 、 电 气 工 程 等 专业 本 科 生 的 “计算 机 网 络 ”课程 教科 书 ， 同 时 也 适合 网 络 技术 
人 员 、 专 业 研究 人 员 阅 读 。 
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MER MUI, WITT AY BL AE AE IE AR, EP ERE BRAS 
的 各 个 领域 取得 了 垄断 性 的 优势 ; 也 正 是 这 样 的 优势 ， 使 美国 在 信息 技术 发 展 的 六 十 多 年 
间 名 家 辈出 、 独 领 风 骚 。 在 商业 化 的 进程 中 ,美国 的 产业 界 与 教育 界 越 来 越 紧 密 地 结合 ， 
计算 机 学 科 中 的 许多 泰山 北斗 同时 身 处 科研 和 教学 的 最 前 线 ， 由 此 而 产生 的 经 典 科 学 著 
作 ， 不 仅 辟 划 了 研究 的 范畴 ， 还 揭示 了 学 术 的 源 变 ， 既 遵循 学 术 规 范 ， 又 自 有 学 者 个 性 ， 
其 价值 并 不 会 因 年 月 的 流逝 而 减退 。 

近年 ， 在 全 球 信息 化 大 潮 的 推动 下 ， 我国 的 计算 机 产业 发 展 迅 猛 ， 对 专业 人 才 的 需求 
日 益 迫 切 。 这 对 计算 机 教育 界 和 出 版 界 都 既是 机 遇 ， 也 是 挑战 ; 而 专业 教材 的 建设 在 教育 
战略 上 显得 举足轻重 。 在 我 国信 息 技 术 发 展 时 间 较 短 的 现状 下 ， 美 国 等 发 达 国 家 在 其 计算 
机 科学 发 展 的 几 十 年 间 积 演 和 发 展 的 经 典 教材 仍 有 许多 值得 借鉴 之 处 。 因 此 ， 引 进 一 批 国 
外 优秀 计算 机 教材 将 对 我 国 计 算 机 教育 事业 的 发 展 起 到 积极 的 推动 作用 ， 也 是 与 世界 接 
轨 、 建 设 真正 的 世界 一 流 大 学 的 必由之路 。 

机 械 工 业 出 版 社 华章 公司 较 早 意识 到 “出 版 要 为 教育 服务 " 。 自 1998 年 开始 ， 我 们 就 
将 工作 重点 放 在 了 六 选 、 移 译 国外 优秀 教材 上 。 经 过 多 年 的 不 懈 努 力 ， 我 们 与 Pearson， 
McGraw-Hill, Elsevier, MIT, John Wiley & Sons, Cengage 等 世界 著名 出 版 公司 建立 了 良好 的 
合作 关系 ， 从 他 们 现 有 的 数 百 种 教材 中 杜 选 出 Andrew S. Tanenbaum, Bjarne Stroustrup, 
Brian W. Kernighan, Dennis Ritchie, Jim Gray, Afred V. Aho, John E. Hopcroft, Jeffrey 
D. Ullman, Abraham Silberschatz, William Stallings, Donald E. Knuth, John L. Hennessy, Larry 
_L. Peterson 等 大 师 名 家 的 一 批 经 典 作 品 ， 以 “计算 机 科学 丛书 ”为 总 称 出 版 ， 供 读者 学 
习 、 研 究 及 珍藏 。 大 理 石 纹理 的 封面 ， 也 正体 现 了 这 套 丛 书 的 品位 和 格调 。 

“计算 机 科学 丛书 ”的 出 版 工作 得 到 了 国内 外 学 者 的 易 力 相助 ， 国 内 的 专家 不 仅 提 供 了 
中 肯 的 选 题 指导 ， 还 不 辞 劳 昔 地 担任 了 翻译 和 审 校 的 工作 ; 而 原 书 的 作者 也 相当 关注 其 作品 
在 中 国 的 传播 ， 有 的 还 专门 为 其 书 的 中 译本 作 序 。 迄 今 , “计算 机 科学 丛书 ”已 经 出 版 了 近 
两 百 个 品种 ， 这 些 书籍 在 读者 中 树立 了 良好 的 口碑 ， 并 被 许多 高 校 采 用 为 正式 教材 和 参考 书 
籍 。 其 影印 版 “经 典 原 版 书库 ”作为 姊妹 篇 也 被 越 来 越 多 实施 双语 教学 的 学 校 所 采用 。 

权威 的 作者 、 经 典 的 教材 、 一 流 的 译 者 、 严 格 的 审 校 、 精 细 的 编辑 ， 这 些 因素 使 我 们 
的 图 书 有 了 质量 的 保证 。 随 着 计算 机 科学 与 技术 专业 学 科 建 设 的 不 断 完 善 和 教材 改革 的 逐 
渐 深 化 ， 教 育 界 对 国外 计算 机 教材 的 需求 和 应 用 都 将 步 和 人 一 个 新 的 阶段 ， 我 们 的 目标 是 尽 
善 尽 美 ， 而 反馈 的 意见 正 是 我 们 达到 这 一 终极 目标 的 重要 帮助 。 华 章 公司 欢迎 老师 和 读者 
对 我 们 的 工作 提出 建议 或 给 予 指正 ， 我 们 的 联系 方法 如 下 : 


华章 网 站 . www. hzbook. com 
电子 邮件 . hzjsj@ hzbook. com 
联系 电话 . (010)88379604 
联系 地 址 ， 北京 市 西城 区 百 万 庄 南 街 1 号 华章 教育 

邮政 编码 : 100037 华章 科技 图 书 出 版 中 心 
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James F. Kurose 是 美国 马萨诸塞 大 学 阿 默 斯 特 分 校 杰 出 的 计算 机 
科学 教授 。 他 目前 担任 美国 国家 科学 基金 会 的 副 主任 ， 领 导 计 算 机 和 
信息 科学 工程 理事 会 。 

Kurose 博士 在 教育 领域 的 活动 获得 了 许多 赞誉 ， 其 中 包括 国立 技 
术 大 学 (8 次 ) 、 马 萨 诸 塞 大 学 和 研究 生 院 东北 联合 会 杰出 教师 奖 。 他 
获得 了 IEEE Taylor Booth HA LE, JA mms T AE B PE E H fa 
信息 技术 促进 会 的 领导 地 位 。 他 多 次 赢得 优秀 会 议论 文 奖 并 获得 IEEE 
Infocom 成 就 奖 和 ACM Sigcomm 的 时 间 考 验 奖 。 

Kurose 博士 是 《IEEE 通信 会 刊 》(IEEE Transactions on Communications ) 和 《IEEE/ACM 
网 络 会 刊 》(IEEEZACM Transactions on Networking) 的 前 任 总 编辑 。 他 担任 了 IEEE Infocom, 
ACM SIGCOMM, ACM 因特网 测量 会 议和 ACM SIGMETRICS 的 技术 程序 的 共同 主席 。 他 是 
IEEE 会 士 (Fellow) 和 ACM 会 士 。 他 的 研究 兴趣 包括 网 络 协 议和 体系 结构 、 网 络 测量 、 多 
la 他 拥有 哥伦比亚 大 学 计算 机 科学 的 博士 学 位 。 

Keith W. Ross 是 美国 纽约 大 学 (NYU) 上 海 分 校 工程 和 计算 机 科学 
学 院 院 长 以 及 NYU 计算 机 科学 和 工程 系 的 Leonard J. Shustek 首席 教 
授 。 在 此 之 前 ， 他 就 职 于 宾夕法尼亚 大 学 (13 年 ) Eurecom 学 院 (5 
年 ) 和 理工 大 学 (10 年 ) 。 他 从 Tufts 大 学 获得 电气 工程 学 士 学 位 ， 从 哥 
伦比 亚 大 学 获得 电气 工程 硕士 学 位 ， 从 密歇根 大 学 获得 计算 机 和 控制 
工程 博士 学 位 。Ross 也 是 Wimba 公司 芮 基 人 和 首 任 CEO ， 该 公司 为 电 
子 学 习 研 发 了 在 线 多 媒体 应 用 并 于 2010 年 被 Blackboard 收购 。 

Ross 教授 的 研究 兴趣 在 隐私 、 社 交 网 络 、 对 等 (P2P) 网 络 、 因 特 网 测量 、 内 容 分 发 网 和 
随机 建 模 等 方面 。 他 是 ACM 会 士 和 IEEE 会 士 ， 获 得 了 Infocom 2009 年 优秀 论文 奖 ， 并 且 获 
得 《多 媒体 通信 》2011 年 和 2008 年 优秀 论文 奖 ( 由 IEEE 通信 学 会 授予 ) 。 他 担任 多 个 杂志 编 
委 和 会 议程 序 委员 会 委员 ， 包 括 《IEEE/ ACM 网 络 会 刊 》、ACM SIGCOMM ACM CoNext 和 
ACM 因特网 测量 会 议 。 他 还 担任 联邦 贸易 委员 会 P2P 文件 共享 方面 的 顾问 。 

陈 鸣 ， 南 京 航 空 航天 大 学 特聘 教授 、 研 究 生 导师 ; 分 别 于 1982 
年 、1988 年 在 解放 盏 信息 工程 学 院 获 得 学 士 、 硕 士 学 位 ， 于 1991 年 
在 解放 军 通信 工程 学 院 获 得 博士 学 位 ，1999 ~ 2000 年 为 美国 哥伦比亚 
大 学 访问 科学 家 ， 现 在 任 中 国 计 算 机 学 会 网 络 与 数据 通信 专 委 会 副 主 
任 ， 是 中 国 通信 学 会 等 多 个 学 术 团体 委员 和 IEEE 会 员 ; 长 期 从 事 网 络 
测量 、 分 布 式 系统 、 未 来 网 络 、 网 络 安全 等 领域 研究 和 教学 工作 ， 近 
期 研究 兴趣 包括 无 人 机 网 络 、 软 件 定 义 网 络 、 网 络 功能 虚拟 化 ; 承担 
了 国家 目 然 科 学 基金 、 国 家 863 、 国 家 973 子 课题 等 项 目 ; 开发 的 多 个 
MEERI 必用 系统 在 多 个 领域 得 到 广泛 应 用 ; 撰写 网 络 著 作 近 10 本 ， 发 表 SCL/EI 

论文 几 十 篇 ， 有 国家 发 明 专 利 10 项 ; 获得 国家 教学 成 果 二 等 奖 1 项 和 省 部 级 科技 进步 二 、 
= eM, 
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我 自 2003 年 起 翻译 Kurose 和 Ross 两 位 教授 合 著 的 《计算 机 网 络 : 自 顶 回 下 方法 》 教 科 
书 ， 至 今 已 经 过 去 15 个 年 头 了 。 连 续 六 次 翻译 这 本 计算 机 网 络 经 典 教科 书 为 我 提供 了 难 
得 的 学 习 机 会 ， 使 我 能 够 静 下 心 来 思考 他 们 的 所 思 所 想 ， 洞 察 他 们 对 技术 发 展 的 分 析 ， 品 
味 他 们 讲解 网 络 原 理 时 的 遗 词 造句 。 尽 管 我 们 能 够 从 多 种 来 源 学 习 、 研 究 网 络 技术 ， 但 是 
通过 这 本 书 ， 我 们 能 够 系统 地 理解 错综复杂 的 网 络 技术 是 如 何 组 织 成 为 复杂 的 网 络 系统 
的 ， 观 察 到 新 型 网 络 技术 是 如 何 替 代 过 时 技术 的 ， 感 受到 一 些 网 络 术语 是 如 何 悄然 变化 
的 ， 学 习 大 师 级 人 物 是 如 何 创 新 网 络 教 学 的 …… 总 之 ， 这 本 教科 书 被 称 为 世界 上 非常 流 
行 、 非 常 优秀 的 网 络 教科 书 的 确 当之无愧 。 同 时 ， 该 书 的 中 译本 有 助 于 我 国 高 校 学 生 、 科 
技工 作者 以 及 其 他 读者 高 效 地 学 习 计 算 机 网 络 知 识 ( 而 不 是 英文 !1) ， 进 一 步 促 进 我 国 网 络 
教学 水 平 的 提升 。 

软件 定义 网 络 (SDN ) 的 发 展 是 网 络 界 近 年 来 非常 重要 和 令 人 兴奋 的 事件 ， 本 书 首次 用 
两 章 的 篇 幅 讨 论 网 络 层 一 一 第 4 章 讨论 网 络 层 的 数据 平面 ， 第 5 章 讨 论 网 络 层 的 控制 平面 
和 网 络 管理 主题 。 与 以 前 的 版 本 一 样 ， 本 书 与 时 俱 进 地 更 新 了 许多 章节 的 内 容 、 习 题 和 网 
站 的 配套 资料 ， 反 映 了 网 络 技术 日 新 月 异 的 发 展 。 

在 本 书 的 翻译 过 程 中 ， 译 者 得 到 了 南京 航空 航天 大 学 计算 机 科学 与 技术 学 院 的 领导 和 
同事 的 支持 和 帮助 。 本 书 的 责任 编辑 刘 立 狠 、 迟 振 春 出 色 的 专业 技能 和 耐心 细致 也 使 本 书 
增色 。 

限于 时 间 和 和 学识， 译文 错漏 难免 ， 请 识 者 不 音 赐 教 。 请 将 问题 发 送 给 mingchennj@ 

163. com ,我 将 及 时 反馈 读者 。 


陈 鸣 
南京 航空 航天 大 学 计算 机 科学 与 技术 学 院 
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欢迎 阅读 4 计算 机 网 络 : 目 顶 向 下 方法 》 的 第 7 版 。 自 从 本 书 第 1 版 于 16 年 前 出 版 以 
来 ， 这 本 书 已 经 被 数 百 所 大 学 和 学 院 采用 ， 被 译 为 14 种 语言 ， 并 被 世界 上 几 十 万 的 学 生 
和 从 业 人 员 使 用 。 我 们 倾听 了 许多 读者 的 意见 ， 赞 扬 之 声 不 绝 于 耳 。 


第 7 WRAY ATA Ah 
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时 俱 进 的 方法 。 在 第 7 版 中 ， 我 们 做 了 不 少 改变 ， 但 也 保持 了 我 们 认为 (并 且 得 到 了 使 用 
本 书 的 教师 和 学 生 的 认可 ) 本 书 最 为 重要 的 方面 : 它 的 自 顶 向 下 方法 ， 它 关注 因特网 和 计 
算 机 网 络 的 现代 处 理 方式 ， 它 的 注重 原理 和 实践 ， 以 及 它 易 于 理解 的 风格 和 学 习 计 算 机 网 
络 的 方法 。 然 而 ， 第 7 版 进行 了 相当 多 的 修订 和 更 新 。 
本 书 的 长 期 读者 将 注意 到 ， 自 该 教科 书 出 版 以 来 ,我 们 首次 改变 了 各 章 的 组 织 结构 。. 
以 往 包 括 在 一 章 中 的 网 络 层 ， 现 在 包括 在 第 4 章 (该 章 关 注 网 络 层 的 所 谓 “ 数 据 平面 "组 
件 ) 和 第 5 章 ( 该 章 关 注 网 络 层 的 “控制 平面 " ) 中 。 网 络 层 范 围 的 扩展 反映 了 软件 定义 网 络 
(SDN ) 重 要 性 的 迅速 提升 ， 无 可 置疑 地 证 明了 十 年 来 网 络 非常 重要 和 令 人 兴奋 的 进展 。 尺 
管 SDN 是 相对 新 近 的 创新 ， 但 它 已 经 迅速 在 实践 中 得 到 应 用 ， 所 以 介绍 现代 计算 机 网 络 
而 不 涉及 SDN 已 经 成 为 不 可 想象 的 事 。 先 前 包括 在 第 9 章 中 的 网 络 管理 主题 ， 现 在 已 经 放 
人 新 的 第 5 章 中 了 。 我 们 一 如 既往 地 更 新 了 本 书 的 许多 其 他 章节 ， 以 反映 自 第 6 版 以 来 网 
络 领 域 的 新 变化 。 从 教科 书 中 撤除 的 材料 一 如 既往 地 能 够 在 本 书 的 配套 网 站 中 找到 。 比 较 
重要 的 一 些 更 新 如 下 : 
© 为 反映 因特网 不 断 增长 的 范围 和 应 用 ， 更 新 了 第 1 章 。 
© 讨论 应 用 层 的 第 2 章 进 行 了 重大 更 新 。 我 们 删除 了 FIP 和 分 布 式 散 列表 的 材料 ， 
增加 了 有 关 应 用 层 视频 流 和 内 容 分 发 网 ， 以 及 Netflix 和 YouTube 学 习 案 例 的 新 节 。 
套 接 字 编 程 已 从 Python 2 更 新 为 Python 3。 
e。 讨论 运输 层 的 第 3 章 进行 了 适度 更 新 。 异 步 传递 方式 ( ATM ) 网 络 的 材料 已 被 更 流 
行 的 因特网 显 式 拥塞 通告 (ECN ) 的 材料 所 代替 ， 用 ECN 教授 相同 的 原理 。 
。 第 4 章 讨论 网 络 层 的 “数据 平面 ”组件 。 数 据 平面 是 每 台 路 由 器 的 转发 功能 ， 它 决 
定 到 达 路 由 器 的 一 条 输入 链 路 的 分 组 是 如 何 转 发 到 该 路 由 器 的 一 条 输出 链 路 的 。 
我 们 更 新 了 在 所 有 前 面 版 本 中 都 能 找到 的 有 关 传 统 因特网 转发 的 材料 ， 并 且 增 加 
了 分 组 调度 的 材料 。 还 增加 了 有 关 通 用 转发 的 新 节 ， 就 像 SDN 中 实践 的 那样 。 该 
章 也 有 很 多 更 新 。 有 关 多 播 和 广播 通信 方面 的 材料 已 被 删除 。 
e 第 5 章 讨 论 网络 层 的 控制 平面 功能 。 这 种 网 络 范围 的 逻辑 控制 着 数据 报 如 何 沿 着 
从 源 主机 到 目的 主机 的 路 由 器 的 端 到 端 路 径 选 择 路 由 。 如 同 前 面 版 本 一 样 ， 我 们 
包括 路 由 选择 算法 以 及 在 今天 的 因特网 中 所 使 用 的 路 由 选择 协议 (更 新 了 对 BCP 
的 讨论 ) 。 增 加 了 有 关 SDN 控制 平面 的 新 节 ， 讲述 了 如 何在 所 谓 的 SDN FE hae P 
实现 路 由 选择 和 其 他 功能 。 
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。 第 7 章 讨 论 无 线 网 络 和 移动 网 络 ， 更 新 了 有 关 802. 11( 所 谓 WiFi) 网 络 和 蜂 窜 网 
络 ( 包 括 4G 和 LIE) 的 材料 。 

。 第 8 章 讨论 网 络 安全 ， 这 在 第 6 版 中 已 经 全 面 更 新 过 了 ， 本 版 中 该 章 仅 进行 了 适 
度 更 新 。 

。 第 9 章 较 之 第 6 版 进行 了 适度 调整 ， 有 关 视 频 流 和 内 容 分 发 网 的 材料 已 经 放 到 第 2 
章 了 ， 有 关 分 组 调度 的 材料 已 经 放 进 第 4 章 了 。 

。 增加 了 与 每 章 后 面 习 题 相关 的 重要 新 材料 。 与 前 面 各 版 一 样 ， 对 课 后 习题 进行 了 
修订 、 增 加 和 删除 。 

在 新 版 本 的 修订 过 程 中 ， 我们 的 目标 一 如 既往 ， 继 续 关注 因特网 和 计算 机 网 络 的 现代 


本 书 读者 对 象 


本 书 适用 于 计算 机 网 络 的 第 一 门 课程 ， 既 可 用 于 计算 机 科学 系 的 学 生 ， 也 可 用 于 电气 
工程 系 的 学 生 。 就 编程 语言 而 言 ， 本 书 仅 假定 学 生 具 有 C, C++, Java 或 Python 的 编程 经 
验 (也 只 是 在 几 个 地 方 用 到 )。 与 许多 入 门 性 的 其 他 计算 机 网 络 教科 书 相 比 ， 尽 管 本 书 表述 
更 为 精确 ， 分 析 更 为 细致 ， 然 而 书 中 很 少 用 到 高 中 阶段 没有 教 过 的 数学 概念 。 我 们 有 意 避 
免 使 用 任何 高 等 微 积 分 、 概 率 论 或 随机 过 程 的 概念 (尽管 我 们 为 具有 这 种 高 级 背景 的 学 生 
准备 了 某 些 课 后 习题 )。 因 此 ， 本 书 适 用 于 本 科 生 课程 和 一 年 级 研究 生 课程 。 它 对 于 电信 
业 的 从 业 人 员 也 应 当 有 用 。 


本 书 的 独特 之 处 


计算 机 网 络 这 门 课程 极为 复杂 ， 涉 及 许多 以 错综复杂 的 方式 彼此 交织 的 概念 、 协 议和 
技术 。 为 了 处 理 这 种 大 跨度 和 高 复杂 性 ， 许 多 计算 机 网 络 教科 书 都 围绕 计算 机 网 络 体 系 结 
构 的 “层次 "来 组 织 内 容 。 借 助 于 这 种 分 层 的 组 织 结构 ， 学 生 能 够 透 过 计算 机 网 络 的 复杂 性 
看 到 其 内 部 ， 他 们 在 学 习 整 个 体系 结构 的 某 个 部 分 中 的 独特 概念 和 协议 的 同时 ， 也 能 看 清 
所 有 这 些 部 分 如 何 整 合 在 一 起 的 全 貌 。 从 教学 法 的 角度 来 看 ， 我 们 的 个 人 体验 是 这 种 分 层 
的 教学 方法 的 确 是 时 有 成 效 的 。 尽 管 如 此 ， 我 们 发 现 那 种 自 底 向 上 的 传统 教学 方法 ， 即 从 
物理 层 到 应 用 层 逐 层 进行 讲解 的 方法 ， 对 于 现代 计算 机 网 络 课程 并 非 是 最 佳 的 方法 。 


自 顶 向 下 方法 


本 书 于 16 年 前 首次 以 和 目 顶 向 下 的 方式 来 对 竺 网络， 这 就 是 说 从 应 用 层 开始 向 下 一 直 
讲 到 物理 层 。 我 们 从 教师 以 及 学 生 那 里 得 到 的 反馈 证 实 了 这 种 目 顶 向 下 方法 有 许多 好 处 ， 
并 且 从 教学 法 来 讲 的 确 很 好 实施 。 第 一 ， 它 特别 强调 应 用 层 ( 它 是 网 络 中 的 “高 增长 领 
域 ")。 的 确 ， 计 算 机 网 络 中 的 许多 近期 革命 都 发 生 在 应 用 层 ， 其 中 包括 Web、 对 等 文件 共 
享 和 媒体 流 。 及 早 强 调 应 用 层 的 问题 与 大 多 数 其 他 教科 书 中 所 采取 的 方法 不 同 ， 那 些 教科 
书 中 只 有 少量 有 关 网 络 应 用 、 网 络 应 用 的 需求 、 应 用 层 范 式 ( 例 如 客户 - 服务 器 和 对 等 方 
到 对 等 方 ) 以 及 应 用 编程 接口 方面 的 内 容 。 第 二 ， 我 们 (和 使 用 本 书 的 许多 教师 ) 作为 教师 
的 经 验 是 ， 在 课程 开始 后 就 教授 网 络 应 用 的 内 容 ， 是 一 种 有 效 激 励 学 习 积极 性 的 工具 。 学 
生 急 于 知道 诸如 电子 邮件 和 Web 等 网 络 应 用 是 如 何 工作 的 ， 这 些 应 用 是 多 数学 生 每 天 都 
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在 使 用 的 东西 。 一 旦 理解 了 这 些 应 用 ， 学 生 便 能 够 理解 支持 这 些 应 用 的 网 络 服务 ， 接 下 来 
则 会 仔细 思考 在 较 低层 次 中 可 能 提供 和 实现 这 些 服务 的 各 种 方式 。 因 此 ， 及 早 地 涉及 应 用 
程序 能 够 激发 学 生 学 习 本 书 其 余部 分 的 积极 性 。 

第 三 ， 自 顶 向 下 方法 使 得 教师 能 够 在 教学 的 早期 阶段 介绍 网 络 应 用 程序 的 开发 。 学 生 
不 仅 能 够 明白 流行 的 应 用 程序 和 协议 的 工作 原理 ， 还 能 学 习 到 创造 自己 的 网 络 应 用 程序 和 
应 用 级 协议 是 多 么 容易 。 采 用 自 项 向 下 的 方法 后 ， 学 生 能 够 及 早 地 搞 清楚 套 接 字 编程 、 服 
务 模型 和 协议 的 概念 ， 这 些 重要 概念 为 后 续 各 层 的 讨论 做 了 铺垫 。 通 过 提供 用 Python 语言 
写成 的 套 接 字 编 程 的 例子 ， 我 们 强调 主要 思想 ， 而 不 会 使 学 生 陷于 复杂 代码 的 困境 。 电 气 
工程 和 计算 机 科学 系 的 本 科 生 理解 这 些 代码 应 当 不 会 有 困难 。 


以 因特网 为 研究 目标 


尽管 自 第 4 版 起 我 们 从 书 名 中 去 掉 了 “Featuring the Internet” (描述 因特网 特色 ) 这 个 短 
语 ， 但 这 并 不 意味 着 我 们 不 再 关注 因特网 ! 的 确 ， 一切 如 初 ! 而 且 由 于 因特网 已 经 变 得 无 
所 不 在 ， 我 们 反而 认为 任何 网 络 教 科 书 都 必须 非常 关注 因特网 ， 因 此 该 短语 在 某 种 程度 上 
已 经 没有 必要 了 。 我 们 继续 使 用 因特网 的 体系 结构 和 协议 作为 基本 载体 来 学 习 基 本 的 计算 
机 网 络 概念 。 当 然 ， 我 们 也 能 把 概念 和 协议 放 入 其 他 网 络 体系 结构 中 讲解 。 但 是 我 们 的 关 
注 焦点 是 因特网 ， 这 反映 在 我 们 围绕 因特网 体系 结构 的 S 层 模型 来 组 织 材料 ， 这 5 个 层次 
是 应 用 层 、 运 输 层 、 网 络 层 、 链 路 层 和 物理 层 。 

聚焦 因特网 的 另 一 个 好 处 是 ， 大 多 数 计算 机 科学 和 电气 工程 的 学 生 急 切 地 希望 学 习 因 
特 网 及 其 协议 。 他 们 知道 因特网 是 一 种 革命 性 和 破坏 性 的 技术 ， 正 在 深刻 地 改变 着 我 们 的 
世界 。 有 了 对 因特网 大 量 中 肯 的 认识 后 ， 学 生 自 然而 然 会 对 学 习 其 内 部 原理 有 了 求知 欲 。 
因此 ， 教 师 用 因特网 作为 导向 焦点 ， 就 易于 调动 学 生 学 习 基 本 原理 的 积极 性 了 。 


教授 网 络 原理 


本 书 的 两 个 独特 之 处 是 自 顶 向 下 方法 和 关注 因特网 ， 这 已 经 显现 在 本 书 的 书 名 中 。 如 
果 我 们 在 副 书 名 中 强行 增加 第 三 个 词 的 话 ， 原 理 一 词 将 包括 在 其 中 。 网 络 领域 已 经 发 展 得 
相当 成 熟 ， 能 够 认识 清楚 许多 基础 性 的 重要 问题 。 例 如 ， 在 运输 层 ， 基 础 性 问题 包括 建立 
在 不 可 靠 的 网 络 层 上 的 可 靠 通信 、 连 接 建立 /拆除 与 握手 、 拥 塞 和 流量 控制 以 及 多 路 复 用 。 
三 个 非常 重要 的 网 络 层 问题 是 ， 在 两 台 路 由 器 之 间 找 到 “好 的 ”路径 、 互 联 大 量 的 异 构 网 络 
和 管理 现代 网 络 的 复杂 性 。 在 链 路 层 ， 基 础 性 问题 是 共享 多 路 访问 信道 。 在 网 络 安全 中 ， 
提供 机 密 性 、 鉴 别 和 报 文 完 整 性 的 技术 都 基于 密码 学 基本 理论 。 本 书 在 指明 基础 性 网 络 问 
题 的 同时 ， 也 会 介绍 解决 这 些 问 题 的 方法 。 学 习 这 些 原理 的 学 生 将 获得 具有 长 "保质 期 "的 
知识 ， 在 今天 的 网 络 标准 和 协议 已 经 变 得 过 时 后 的 很 长 时 间 ， 其 中 的 原理 将 仍然 重要 和 中 
肯 。 我 们 相信 ， 用 因特网 将 学 生 引 入 网 络 之 门 后 ， 再 强调 基础 性 问题 及 其 解决 方案 ， 这 种 
两 者 结合 的 方法 将 使 他 们 迅速 理解 几乎 任何 网 络 技术 。 


Web 站 点 


KEMER Web 站 点 位 于 http://www. pearsonhighered. com/cs-resources/。 该 站 点 
包括 : 


© 交互 式 学 习 材 料 。 本 书 的 配套 网 站 包括 视频 要 点 ( VideoNotes) ， 即 由 作者 制作 

的 全 书 重要 主题 的 视频 呈现 ， 以 及 对 习题 解答 的 简要 讲解 ， 这 些 习 题 类 似 于 

每 章 后 面 的 习题 。 我 们 已 经 在 Web 站 点 上 提供 了 第 1 ~5 章 的 视频 要 点 和 在 线 

习题 ， 并 且 将 随 着 时 间 的 推移 而 继续 积极 地 增加 和 更 新 这 些 材 料 。 如 在 前 面 

版 本 中 一 样 ， 该 Web 站 点 包含 了 交互 式 Java 小 程序 ， 以 动画 方式 显示 了 重要 

的 网 络 概 念 。 该 站 点 也 包括 交互 式 小 测验 ， 允许 学 生 检 查 他 们 对 该 专题 内 容 

的 基本 理解 。 教 授 能 够 将 这 些 交 互 式 特色 结合 到 他 们 的 讲义 中 或 将 它们 用 作 

小 实验 。 

附加 的 技术 材料 。 由 于 我 们 在 本 书 的 每 个 版 本 中 都 增加 了 新 材料 ， 故 我 们 不 得 不 

删 去 某 些 现 有 主题 以 保持 篇 幅 的 合理 。 例 如 ， 为 了 在 本 版 中 为 新 材料 腾 出 空间 ， 

我 们 删除 了 有 关 FTP、 分 布 式 散 列 表 和 多 播 方面 的 材料 。 出 现在 本 书 较 早 版 本 中 

的 材料 仍然 是 有 益 的 ， 并 且 能 够 在 本 书 Web 网 站 上 找到 。 

© 编程 作业 。Web 网 站 也 提供 了 一 些 详细 的 编程 作业 ， 这 些 编程 作业 包括 构建 
一 台 多 线程 Web 服务 器 ， 构 建 一 个 具有 图 形 用 户 接 口 (GUI) 的 电子 邮件 客户 ， 
以 及 发 送 端 和 接收 端 可 靠 数 据 传输 协议 的 编程 ， 分 布 式 路 由 选择 算法 的 编程 ， 
等 等 。 

e Wireshark 实验 。 通 过 观察 网 络 协 议 的 实际 运行 ， 读 者 能 够 大 大 加 深 对 它们 的 理 
解 。 该 Web 站 点 提供 了 许多 Wireshark 作业 ， 使 学 生 能 够 实际 观察 两 个 协议 实体 
之 间 报 文 的 交换 顺序 。 该 Web 站 点 包括 了 有 关 HTTP, DNS, TCP, UDP, IP, IC- 
MP、 以 太 网 、ARP、WiFi 和 SSL 的 单独 Wireshark 实验 ， 以 及 在 跟踪 一 个 获取 
Web 网 页 的 请 求 时 所 涉及 的 所 有 协议 的 Wireshark 实验 。 随 着 时 间 的 推移 ， 我 们 将 
继续 增加 新 的 实验 。 

除了 配套 网 站 外 ， 作 者 维护 了 一 个 公共 网 站 http : //gaia. cs. umass. edu/kurose_ross/in- 

teractive， 该 网 站 包括 交互 式 练 习 ， 这 些 练习 能 够 生成 与 每 章 后 面 所 选 习 题 类 似 的 问题 

(并 给 出 解答 )。 由 于 学 生 能 够 产生 无 数 类 似 问题 的 实例 并 看 到 解答 ， 所 以 他 们 能 够 练习 到 

真正 掌握 为 止 。 


教学 特色 


我 们 每 位 作者 都 教 了 30 多 年 的 计算 机 网 络 课 程 ， 这 本 书 凝 聚 了 我 们 总 共 60 多 年 教 
了 几 千 名 学 生 的 教学 经 验 。 在 此 期 间 ， 我 们 也 成 为 计算 机 网 络 领 域 活路 的 研究 人 员 。 
(事实 上 ，James 和 Keith 于 1979 年 在 哥伦比亚 大 学 彼此 相识 ， 共 同 选 了 由 Mischa Schw- 
artz 执教 的 硕士 研究 生计 算 机 网 络 课程 。) 所 有 这 些 都 让 我 们 对 网 络 现状 和 网 络 未 来 的 
可 能 发 展 方 向 有 了 良好 的 观察 力 。 无 论 如 何 ， 我 们 在 组 织 这 本 书 的 材料 时 ， 抵 御 住 了 偶 
向 自己 所 钟爱 的 研究 项 目的 诱惑 。 如 果 你 对 我 们 的 研究 工作 感 兴 趣 的 话 ， 可 以 访问 我 们 
的 个 人 Web 网 站 。 因 此 ， 这 是 一 本 关于 现代 计算 机 网 络 的 书 ， 即 该 书包 含 了 当代 协议 
和 技术 以 及 支撑 这 些 协 议和 技术 的 基本 原理 。 我 们 也 认为 学 习 (和 讲授 ) 网 络 是 令 人 
开心 的 事 。 本 书 中 包括 的 幽默 、 使 用 的 类 比 和 现实 世界 的 例子 将 有 望 使 这 些 材料 更 具 趣 
味 性 。 


教师 的 补充 材料 


我 们 提供 了 一 套 完整 的 补充 材料 ， 以 帮助 教师 教授 这 门 课 程 。 这 些 材料 都 能 通过 访问 
Pearson 的 教师 资源 中 心 (http://www. pearsonhighered. com/irc) 得 到 。 有 关 获 取 这 些 教师 
补充 材料 的 信息 可 访问 教师 资源 中 心 。 

e PowerPoint 幻灯 片 。 我 们 提供 了 全 部 9 章 的 PowerPoint 幻灯 片 。 这 些 幻 灯 片 根据 

第 7 版 进行 了 彻底 更 新 ， 详 细 地 涵盖 了 每 章 的 内 容 。 幻 灯 片 中 使 用 了 图 片 和 动 
m (而 非 仅 是 单调 的 文本 标题 ) ， 这 使 得 它们 有 趣 且 在 视觉 上 有 吸引 力 。 我 们 辕 
教师 提供 了 原始 的 约 灯 片 ， 使 得 教师 能 够 做 个 性 化 修改 以 满足 自己 的 教学 需要 。 
这 些 幻灯 片 中 的 某 些 部 分 就 是 由 采用 本 书 进行 教学 的 教师 所 贡献 的 。 

© 课 后 习题 解答 。 我 们 提供 了 本 书 中 课 后 习题 的 解 题 手册 、 编 程 作业 和 Wireshark SC 

验 。 如 前 所 述 ， 我 们 在 本 书 的 前 6 章 中 引入 了 许多 新 的 课 后 作业 。 


各 章 间 的 关联 性 


本 书 的 第 1 章 提 供 了 对 计算 机 网 络 自 包含 的 概述 。 该 草 介 绍 了 许多 重要 的 概念 与 术 
语 ， 为 本 书 的 其 余部 分 莫 定 了 基础 。 其 他 所 有 章 都 直接 依赖 于 第 1 章 的 内 容 。 在 讲解 完 第 
1 章 之 后 ， 我 们 推荐 按 顺序 讲解 第 2 ~6 章 的 内 容 ， 这 样 就 遵循 了 自 顶 向 下 的 原则 。 第 2 ~ 
6 章 中 每 一 章 都 会 用 到 前 面 章节 的 内 容 。 在 完成 前 6 章 的 教学 后 ， 教 师 就 有 了 相当 大 的 灵 
活性 。 最 后 3 章 之 间 没 有 任何 相关 性 ， 因 此 能 够 以 任何 顺序 进行 教学 。 然 而 ， 最 后 3 章 中 
的 每 一 章 都 依赖 于 前 6 章 中 的 材料 。 许 多 教师 采用 的 教学 方案 是 : 教授 前 6 章 ， 然 后 讲授 
后 3 章 之 一 作为 点 睛 之 笔 。 


最 后 的 话 : 我 们 乐于 听取 你 的 意见 


我 们 鼓励 学 生 和 教师 向 我 们 发 送 电子 邮件 ， 发 表 对 本 书 的 任何 评论 。 对 我 们 而 言 ， 
能 够 听 到 来 自 全 世界 的 教师 和 学 生 就 本 书 前 6 版 的 反馈 ， 是 件 令 人 愉快 的 事 。 我 们 已 经 
在 本 书 新 版 中 综合 进 许多 条 建议 。 我 们 也 鼓励 教师 向 我 们 发 送 新 的 课 后 习题 (及 其 解 
答 ) ， 这 将 完善 当前 的 课 后 习题 。 我 们 将 这 些 习题 放 在 配套 Web 网 站 上 只 有 教师 才能 访 
问 的 区 域 。 我 们 也 鼓励 教师 和 学 生 编写 新 的 Java 小 程序 来 诠释 书 中 的 概念 和 协议 。 如 果 
你 有 了 认为 适合 于 本 书 的 小 程序 ， 请 将 它 发 送 给 作者 。 如 果 该 小 程序 (包括 标记 和 术 
语 ) 合适 的 话 ， 我 们 很 乐意 将 它 放 在 本 书 的 网 站 上 ， 并 附 上 对 该 小 程序 作者 的 适当 
推荐 。 

正如 谚语 所 说 :“ 让 那些 卡片 和 信件 到 来 吧 ! ”我 们 郑重 宣布 ， 请 大 家 一 如 既往 地 告诉 
我 们 有 趣 的 URL， 指 出 排版 错误 ， 说 出 不 赞成 我 们 的 哪些 主张 ， 告诉 我 们 怎样 做 效果 好 、 
怎样 做 效果 不 好 ， 以 及 你 认为 在 本 书 下 一 版 中 应 当 包 括 哪些 内 容 、 删 除 哪些 内 容 。 我 们 的 
电子 邮件 地 址 是 kurose@ cs. umass. edu 和 ross@ poly. edu。 


名” 关于 本 书 教 辅 资源 ， 只 有 使 用 本 书 作 为 教材 的 教师 才 可 以 申请 ， 需 要 的 教师 请 联系 机 械 工业 出 版 社 华章 公 
司 ， 电 话 136 0115 6823, ， 邮 箱 wangguang@ hzbook. com. 一 一 编辑 注 
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| 第 1 章 


Computer Networking; A Top-Down Approach, Seventh Edition 


计算 机 网 络 和 因特网 





今天 的 因特网 无 疑 是 有 史 以 来 由 人 类 创造 、 精 心 设计 的 最 大 系统 ， 该 系统 具有 数 以 亿 
计 的 相连 的 计算 机 、 通 信和 链 路 和 交换 机 ， 有 数 十 亿 的 用 便携 计算 机 、 平 板 电脑 和 智能 手机 
连接 的 用 户 ， 并 且 还 有 一 批 与 因特网 连接 的 “物品 ”， 包 括 游戏 机 、 监 视 系 统 、 手 表 、 眼 
镜 、 温 度 调节 装置 、 体 重 计 和 汽车 。 面 对 如 此 巨大 并 且 具 有 如 此 众多 不 同 组 件 和 用 户 的 因 
特 网 ， 是 否 能 够 理解 它 的 工作 原理 ? 是 否 存在 某 些 指导 原则 和 结构 ， 能 够 作为 理解 这 种 规 
模 和 复杂 程度 惊人 的 系统 的 基础 ” 这样 的 话 ， 能 让 学 习 计 算 机 网 络 成 为 既 引 人 入 胜 又 趣味 
me RSENS? 幸运 的 是 ， 对 所 有 这 些 问题 都 是 响亮 的 肯定 答复 。 本 书 的 目的 的 确 是 向 读者 
介绍 计算 机 网 络 这 个 动态 领域 的 最 新 知识 ， 使 他 们 深入 地 理解 网 络 的 原则 和 实践 ， 使 读者 
不 仅 能 理解 今天 的 网 络 ， 而 且 能 理解 明天 的 网 络 。 

第 1 章 概述 了 计算 机 网 络 和 因特网 。 这 一 章 的 目标 是 从 整体 上 粗 线条 地 勾勒 出 计算 机 
网 络 的 概貌 ， 并 且 描 述 本 书 内 容 的 框架 。 这 一 章 包 括 大 量 的 背景 知识 ， 讨 论 大 量 的 计算 机 
网 络 构件 ， 而 且 将 它们 放 在 整个 网 络 的 大 环境 中 进行 讨论 。 

本 章 将 以 如 下 方式 组 织 计 算 机 网 络 的 概述 : 在 介绍 了 某 些 基本 术语 和 概念 后 ， 将 首先 
查看 构成 网 络 的 基本 硬件 和 软件 组 件 。 我 们 从 网 络 的 边缘 开始 ， 考 察 在 网 络 中 运行 的 端 系 
统 和 网 络 应 用 ; 接 下 来 探究 计算 机 网 络 的 核心 ， 查 看 传输 数据 的 链 路 和 交换 机 ， 以 及 将 端 
系统 与 网 络 核心 相连 接 的 接 人 网 和 物理 媒体 。 我 们 将 了 解 因特网 是 “网 络 的 网 络 ”， 并 将 
得 知 这 些 网 络 是 怎样 彼此 连接 起 来 的 。 

在 浏览 完 计算 机 网 络 的 边缘 和 核心 之 后 ， 本 章 的 后 半 部 分 将 从 更 广泛 、 更 抽象 的 角度 来 
考察 计算 机 网 络 。 我 们 将 考察 在 计算 机 网 络 中 数据 的 时 延 、 丢 包 和 吞吐 量 ， 给 出 一 个 端 到 端 
否 吐 量 和 时 延 的 简单 定量 模型 :该 模型 兼顾 了 传输 、 传 播 和 排队 时 延 等 因素 。 接 下 来 ,我们 
将 介绍 计算 机 联网 时 的 一 些 关 键 的 体系 结构 原则 ， 如 协议 分 层 和 服务 模型 。 我 们 还 将 了 解 到 
计算 机 网 络 对 于 许多 不 同类 型 的 攻击 来 说 是 脆弱 的 ， 将 回顾 其 中 的 某 些 攻击 并 且 考 虑 使 计算 
机 网 络 更 为 安全 的 方法 。 最 后 ， 我 们 将 以 计算 机 网 络 的 简要 历史 结束 本 章 的 学 习 。 


1.1 什么 是 因特网 


在 本 书 中 ， 我 们 使 用 一 种 特定 的 计算 机 网 络 ， 即 公共 因特网 ， 作 为 讨论 计算 机 网 络 及 
其 协议 的 主要 载体 。 但 什么 是 因特网 ?” 回答 这 个 问题 有 两 种 方式 : 其 一 ， 我们 能 够 描述 因 
特 网 的 具体 构成 ， 即 构成 因特网 的 基本 硬件 和 软件 组 件 ; 其 二 ， 我 们 能 够 根据 为 分 布 式 应 
用 提供 服务 的 联网 基础 设施 来 描述 因特网 。 我 们 先 从 描述 因特网 的 具体 构成 开始 ， 并 用 
图 1-1 举例 说 明 我 们 的 讨论 。 


1.1.1 具体 构成 描述 


因特网 是 一 个 世界 范围 的 计算 机 网 络 ， 即 它 是 一 个 互联 了 遍及 全 世界 数 十 亿 计 算 设备 
的 网 络 。 在 不 久 前 ， 这 些 计算 设备 多 数 是 传统 的 桌面 PC. Linux 工作 站 以 及 所 谓 的 服务 套 
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(它们 用 于 存储 和 传输 Web 页 面 和 电子 邮件 报 文 等 信息 ) 。 然 而 ， 越 来 越 多 的 非 传 统 的 因 
特 网 “物品 ”( 如 便携 机 、 智 能 手机 、 平 板 电 脑 、 电 视 、 游 戏 机 、 温 度 调节 装置 、 家 用 安 
全 系统 、 家 用 电器 、 手 表 、 了 眼镜、 汽车、 运输 控制 系统 等 ) 正在 与 因特网 相连 。 的 确 ， 在 
许多 非 传 统 设备 连接 到 因特网 的 情况 下 ， 计 算 机 网 络 (computer network) 这 个 术语 开始 听 
起 来 有 些 过 时 了 。 用 因特网 术语 来 说 ， 所 有 这 些 设备 都 称 为 主机 (host) 或 端 系 统 (end 
system ) 。 据 估计 ， 到 2015 FAKA 50 亿 台 设备 与 因特网 连接 ， 而 到 2020 年 该 数字 将 达 
250 亿 [Gartner 2014 ] 。2015 年 ， 全 世界 已 有 超过 32 亿 因 特 网 用 户 ， 接 近世 界 人 口 的 
40% [ITU 2015 ] 。 





主机 服务 器 移动 路 由 器 链 路 层 ”调制 智能 蜂窝 
(或 端 系统 ) 设备 交换 机 解 调 器 手机 Bia 


o $ ae 


平板 交通 温度 Bk ”计算 机 
电脑 。” 信号 灯 调节 器 监视 器 


图 1-1 因特网 的 一 些 部 件 
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端 系 统 通过 通信 链 路 (communication link) 和 分 组 交换 机 (packet switch) 连接 到 一 
起 。 在 1.2 节 中 ,我 们 将 介绍 许多 类 型 的 通信 链 路 ， 它 们 由 不 同类 型 的 物理 媒体 组 成 。 这 
些 物理 媒体 包括 同 轴 电 缆 、 铜 线 、 光 纤 和 无 线 电 频 谱 。 不 同 的 链 路 能 够 以 不 同 的 速率 传输 
数据 ， 链 路 的 传输 速率 (transmission rate) 以 比特 / 秒 (bit/s, 或 bps) 度量 。 当 一 台 端 系 
统 要 向 另 一 台 端 系统 发 送 数据 时 ， 发 送 端 系统 将 数据 分 段 ， 并 为 每 段 加 上 首部 字 节 。 由 此 
形成 的 信息 包 用 计算 机 网 络 的 术语 来 说 称 为 分 组 (packet) 。 这 些 分 组 通过 网 络 发 送 到 目 
的 端 系统 ， 在 那里 被 装配 成 初始 数据 。 

分 组 交换 机 从 它 的 一 条 人 通信 和 链 路 接收 到 达 的 分 组 ， 并 从 它 的 一 条 出 通信 链 路 转发 该 
分 组 。 市 面 上 流行 着 各 种 类 型 、 各 具 特 色 的 分 组 交换 机 ， 但 在 当今 的 因特网 中 ， 两 种 最 著 
名 的 类 型 是 路 由 器 (router) 和 链 路 层 交 换 机 (link-layer switch) 。 这 两 种 类 型 的 交换 机 朝 
着 最 终 目 的 地 转发 分 组 。 链 路 层 交 换 机 通常 用 于 接 入 网 中 ， 而 路 由 器 通常 用 于 网 络 核心 
中 。 从 发 送 端 系统 到 接收 端 系统 ， 一 个 分 组 所 经 历 的 一 系列 通信 链 路 和 分 组 交换 机 称 为 通 
过 该 网 络 的 路 径 (route 或 path) 。 思 科 公 司 估计 到 2016 年 年 底 全 球 年 度 IP 流量 将 超过 泽 
字 节 (zettabyte，10” 字 节 )， 到 2019 年 将 达 每 年 2 泽 字 节 [Cisco VNI 2015], 

用 于 传送 分 组 的 分 组 交换 网 络 在 许多 方面 类 似 于 承载 运输 车 辆 的 运输 网 络 ， 该 网 络 包 
括 了 高 速 公 路 、 公 路 和 交叉 口 。 例 如 ， 考 虑 下 列 情况 ， 一 个 工厂 需要 将 大 量 货物 搬运 到 数 
千 公 里 以 外 的 某 个 目的 地 仓库 。 在 工厂 中 ,货物 要 分 开 并 装 上 卡车 车 队 。 然 后 ， 每 辆 卡车 
独立 地 通过 高 速 公 路 、 公 路 和 立交 桥 组 成 的 网 络 向 仓库 运送 货物 。 在 目的 地 仓库 ， 印 下 这 
些 货物 ， 并 且 与 一 起 装载 的 同一 批 货 物 的 其 余部 分 堆放 在 一 起 。 因 此 ， 在 许多 方面 ， 分 组 
类 似 于 卡车 ， 通 信和 链 路 类 似 于 高 速 公 路 和 公路 ， 分 组 交换 机 类 似 于 交叉 口 ， 而 端 系统 类 似 
于 建筑 物 。 就 像 卡 车 选取 运输 网 络 的 一 条 路 径 前 行 一 样 ， 分 组 则 选取 计算 机 网 络 的 一 条 路 
径 前 行 。 

端 系统 通过 因特网 服务 提供 商 ( Internet Service Provider, ISP) 接 人 和 人 因特网， 包括 如 
”本 地 电缆 或 电话 公司 那样 的 住宅 区 ISP、 公 司 ISP、 大 学 ISP， 在 机 场 、 旅 馆 、 咖 啡 店 和 其 
他 公共 场所 提供 Wiki 接 入 的 ISP， 以 及 为 智能 手机 和 其 他 设备 提供 移动 接 入 的 蜂 窜 数据 
ISP。 每 个 ISP 自身 就 是 一 个 由 多 人 台 分 组 交换 机 和 多 段 通信 链 路 组 成 的 网 络 。 各 ISP 为 端 系 
统 提 供 了 各 种 不 同类 型 的 网 络 接 人 人， 包括 如 线 缆 调 制 解 调 器 或 DSL 那样 的 住宅 宽带 接 人 、 
高 速 局 域 网 接 人 和 移动 无 线 接 人 。ISP 也 为 内 容 提供 者 提供 因特网 接 人 服务 ， 将 Web 站 点 
和 视频 服务 器 直接 连 人 人 因特网。 因特网 就 是 将 端 系统 彼此 互联 ， 因 此 为 端 系统 提供 接 人 的 
ISP 也 必须 互联 。 较 低层 的 ISP 通过 国家 的 、 国 际 的 较 高 层 ISP (如 Level 3 Communica- 
tions, AT&T, Sprint 和 NTT) 互联 起 来 。 较 高 层 ISP 是 由 通过 高 速 光纤 链 路 互联 的 高 速 路 
由 器 组 成 的 。 无 论 是 较 高 层 还 是 较 低 层 ISP 网络， 它们 每 个 都 是 独立 管理 的 ， 运 行 着 卫 协 
议 ( 详 情 见 后 ) ， 遵 从 一 定 的 命名 和 地 址 规则 。 我 们 将 在 1.3 节 中 更 为 详细 地 考察 ISP 及 
其 互联 的 情况 。 

端 系统 、 分 组 交换 机 和 其 他 因特网 部 件 都 要 运行 一 系列 协议 (protocol) ， 这 些 协 议 控 
制 因 特 网 中 信息 的 接收 和 发 送 。TCP (Transmission Control Protocol, ， 传 输 控 制 协议 ) AN IP 
(Internet Protocol ， 网 际 协议 ) 是 因特网 中 两 个 最 为 重要 的 协议 。IP 协议 定义 了 在 路 由 器 
和 端 系 统 之 间 发 送 和 接收 的 分 组 格式 。 因 特 网 的 主要 协议 统称 为 TCP/IP。 我 们 在 这 一 章 
中 就 开始 接触 这 些 协 议 。 但 这 仅仅 是 个 开始 ， 本 书 的 许多 地 方 与 计算 机 网 络 协 议 有 关 。 

鉴于 因特网 协议 的 重要 性 ， 每 个 人 就 各 个 协议 及 其 作用 取得 一 致 认识 是 很 重要 的 ， 这 
样 人 们 就 能 够 创造 协同 工作 的 系统 和 产品 。 这 正 是 标准 发 挥 作用 的 地 方 。 因 特 网 标准 
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(Internet standard) 由 因特网 工程 任务 组 (Internet Engineering Task Force, IETF) [IETF 
2016] BRA. IETF 的 标准 文档 称 为 请 求 评 论 (Request For Comment, RFC), RFC 最 初 只 
是 普通 的 请 求 评论 〈 因 此 而 得 名 ) ， 目 的 是 解决 因特网 先驱 者 们 面临 的 网 络 和 协议 问题 
[ Allman 2011], RFC 文档 往往 是 技术 性 很 强 并 相当 详细 的 。 它 们 定义 了 TCP、IP、HTTP 
(FA Web) 和 SMTP (用 于 电子 邮件 ) 等 协议 。 目 前 已 经 有 将 近 7000 个 RFKC。 其 他 组 织 
也 在 制定 用 于 网 络 组 件 的 标准 ， 最 引 人 注 目的 是 针对 网 络 链 路 的 标准 。 例 如 ，IEEF 802 
LAN/MAN 标准 化 委员 会 【IEEE 802 2016] 制定 了 以 太 网 和 无 线 WiFi 的 标准 。 


1.1.2 服务 描述 


前 面 的 讨论 已 经 辨识 了 构成 因特网 的 许多 部 件 。 但 是 我 们 也 能 从 一 个 完全 不 同 的 角 
度 ， 即 从 为 应 用 程序 提供 服务 的 基础 设施 的 角度 来 描述 因特网 。 除 了 诸如 电子 邮件 和 
Web 冲浪 等 传统 应 用 外 ， 因 特 网 应 用 还 包括 移动 智能 手机 和 平板 电脑 应 用 程序 ， 其 中 包 
括 即时 讯息 、 与 实时 道路 流量 信息 的 映射 、 来 自 云 的 音乐 流 、 电 影 和 电视 流 、 在 线 社交 
网 络 、 视 频 会 议 、 多 人 游戏 以 及 基于 位 置 的 推荐 系统 。 因 为 这 些 应 用 程序 涉及 多 个 相互 
交换 数据 的 端 系 统 ， 故 它们 被 称 为 分 布 式 应 用 程序 (distributed application), MRA, 
因特网 应 用 程序 运行 在 端 系统 上 ， 即 它们 并 不 运行 在 网 络 核心 中 的 分 组 交换 机 中 。 尽 管 - 
分 组 交换 机 能 够 加 速 端 系统 之 间 的 数据 交换 ， 但 它们 并 不 在 意 作为 数据 的 源 或 箱 的 应 用 
程序 。 

我 们 稍 深入 地 探讨 一 下 为 应 用 程序 提供 服务 的 基础 设施 的 含义 。 为 此 ， 假 定 你 对 茶 种 
分 布 式 因特网 应 用 有 一 个 激动 人 心 的 新 想法 ， 它 可 能 大 大 地 造福 于 人 类 ， 或 者 它 可 能 直接 
使 你 名 利 双 收 。 你 将 如 何 把 这 种 想法 转换 成 一 种 实际 的 因特网 应 用 呢 ? 因为 应 用 程序 运行 
在 端 系 统 上 ， 所 以 你 需要 编写 运行 在 端 系统 上 的 一 些 软件 。 例 如 ， 你 可 能 用 Java, C 或 
Python 编写 软件 。 此 时 ， 因 为 你 在 研发 一 种 分 布 式 因特网 应 用 程序 ， 运 行 在 不 同 端 系统 上 
的 软件 将 需要 互相 发 送 数 据 。 此 时 我 们 碰 到 一 个 核心 问题 ， 这 个 问题 导致 了 为 一 种 描述 因 
特 网 的 方法 ， 即 将 因特网 描述 为 应 用 程序 的 平台 。 运 行 在 一 个 端 系统 上 的 应 用 程序 怎样 才 
能 指令 因特网 癌 运 行 在 另 一 个 端 系统 上 的 软件 发 送 数据 呢 ? 

与 因特网 相连 的 端 系 统 提 供 了 一 个 套 接 字 接 口 ( socket interface) ， 该 接口 规定 了 运行 
在 一 个 端 系统 上 的 程序 请 求 因特网 基础 设施 向 运行 在 另 一 个 端 系统 上 的 特定 目的 地 程序 交 
付 数 据 的 方式 。 因 特 网 套 接 字 接 口 是 一 套 发 送 程序 必须 遵循 的 规则 集合 ， 因 此 因特网 能 够 
将 数据 交付 给 目的 地 。 我 们 将 在 第 2 章 详 细 讨 论 因 特 网 套 接 字 接 口 。 此 时 ， 我 们 做 一 个 简 
单 的 类 比 ， 在 本 书 中 我 们 将 经 常 使 用 这 个 类 比 。 假 定 Alice 使 用 邮政 服务 向 Bob 发 一 封 信 。 
当然 ，Alice 不 能 只 是 写 了 这 封 信 (相关 数据 ) 然后 把 该 信 丢 出 窗外 。 相 反 ， 邮 政 服 务 要 
K Alice 将 信 放 人 一 个 信封 中 ; 在 信封 的 中 间 写 上 Bob 的 全 名 、 地 址 和 邮政 编码 ; 封 上 信 
封 ; 在 信封 的 右上 角 贴 上 邮票 ; 最 后 将 该 信封 丢 进 一 个 邮局 的 邮政 服务 信箱 中 。 因 此 ， 该 
邮政 服务 有 自己 的 “邮政 服务 接口 ”或 一 套 规则 ， 这 是 Alice 必须 遵循 的 ， 这 样 邮政 服务 
才能 将 她 的 信件 交付 给 Bob。 同 理 ， 因 特 网 也 有 一 个 发 送 数 据 的 程序 必须 遵循 的 套 接 字 接 
口 ， 使 因特网 向 接收 数据 的 程序 交付 数据 。 

当然 ， 邮 政 服务 向 顾客 提供 了 多 种 服务 ， 如 特快 专递 、 挂 号 、 普 通 服 务 等 。 同 样 A 
特 网 向 应 用 程序 提供 了 多 种 服务 。 当 你 研发 一 种 因特网 应 用 程序 时 ， 也 必须 为 你 的 应 用 程 
序 选 择 其 中 的 一 种 因特网 服务 。 我 们 将 在 第 2 章 中 描述 因特网 服务 。 

我 们 已 经 给 出 了 因特网 的 两 种 描述 方法 : 一 种 是 根据 它 的 硬件 和 软件 组 件 来 描述 ， 另 
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一 种 是 根据 基础 设施 向 分 布 式 应 用 程序 提供 的 服务 来 描述 。 但 是 ， 你 也 许 还 是 对 什么 是 因 
特 网 感到 困惑 。 什 么 是 分 组 交换 和 TCP/IP? 什么 是 路 由 器 ?因特网 中 正在 使 用 什么 样 的 
通信 和 链 路 ?什么 是 分 布 式 应 用 ? 一 个 恒温 调节 顺 或 人 体 秤 如 何 与 因特网 相连 ? 如 果 你 现在 
还 对 这 些 心 存疑 惑 ， 请 不 要 担心 。 这 本 书 除了 向 你 介绍 因特网 的 具体 构成 外 ， 还 要 介绍 支 
配 因特网 的 工作 原理 以 及 它 工 作 的 来 龙 去 脉 。 我 们 将 在 后 续 章 节 中 解释 这 些 重要 的 术语 和 
问题 。 


1.1.3 ”什么 是 协议 


既然 我 们 已 经 对 因特网 是 什么 有 了 一 点 印象 ， 那 么 下 面 考虑 计算 机 网 络 中 另 一 个 重要 
MERIA: 协议 (protocol) 。 什 么 是 协议 ? 协议 是 用 来 干什么 的 ? 

1. 人 类 活动 的 类 比 

也 许 理解 计算 机 网 络 协议 这 一 概念 的 一 个 最 容易 办 法 是 ， 先 与 某 些 人 类 活动 进行 类 
比 ， 因 为 我 们 人 类 无 时 无 刻 不 在 执行 协议 。 考 虑 当 你 想 要 向 某 人 询问 时 间 时 将 要 怎样 做 。 
图 1-2 中 显示 了 一 种 典型 的 交互 过 程 。 人 类 协议 (至 少 说 是 好 的 行为 方式 ) 要 求 一 方 首先 
进行 问候 (图 1-2 中 的 第 一 个 “你 好 ) ， 以 开始 与 男 一 个 人 的 通信 。 对 “你 好 ”的 典型 
响应 是 返回 一 个 “你 好 ” 报 文 。 此 人 用 一 个 热情 的 “你 好 ”进行 响应 ， 隐 含 着 一 种 指示 ， 
表明 能 够 继续 向 那 人 询问 时 间 了 。 对 最 初 的 “你 好 ”的 不 同 响应 (例如 “不 要 烦 我 1”， 
或 “我 不 会 说 英语 ”"， 或 某 些 不 合 时 宜 的 回答 ) 也 许 表明 了 一 个 勉强 的 或 不 能 进行 的 通 
信 。 在 此 情况 下 ， 按 照 人 类 协议 ， 发 话 者 就 不 能 询问 时 间 了 。 有 时 ， 问 的 问题 根本 得 不 到 
任何 回答 ， 在 此 情况 下 ， 发 话 者 通常 会 放弃 向 这 个 人 询问 时 间 。 注 意 在 我 们 人 类 协议 中 ， 
有 我 们 发 送 的 特定 报 文 ， 也 有 了 我 们 根据 接收 到 的 应 答 报 文 或 其 他 事件 (例如 在 某 个 给 
时 间 内 没有 回答 ) 采取 的 动作 。 显 然 ， 发 送 和 接收 的 报 文 ， 以 及 这 些 报 文 发 送 和 接收 或 其 
他 事件 出 现时 所 采取 的 动作 ， 这 些 在 一 个 人 关 协 议 中 起 到 了 核心 作用 。 如 果 人 们 使 用 不 同 
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时 间 时 间 时 间 时 间 
图 1-2 人 类 协议 和 计算 机 网 络 协议 
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的 协议 (例如 ， 如 果 一 个 人 讲 礼貌 ， 而 男 一 人 不 讲 礼貌 ， 或 一 个 人 明白 时 间 的 概念 ， 而 男 
一 人 却 不 理解 ) ， 这 些 协议 就 不 能 交互 ， 因 而 不 能 完成 有 用 的 工作 。 在 网 络 中 这 个 道理 同 
样 成 立 。 即 为 了 完成 一 项 工作 ， 要 求 两 个 〈 或 多 个 ) 通信 实体 运行 相同 的 协议 。 

我 们 再 考虑 第 二 个 人 类 类 比 的 例子 。 假 定 你 正在 大 学 课堂 里 上 课 (例如 上 的 是 计算 
HLA RE) o AON IE A B e o o HRH, mA RA E A A F R M: 
“HFAA A?” (教师 发 送出 一 个 报 文 ， 该 报 文 被 所 有 没有 睡觉 的 学 生 接 收 到 
To) 你 举 起 了 手 ( 癌 教师 发 送 了 一 个 隐 含 的 报 文 )。 这 位 教师 面 带 微笑 地 示意 你 说 : 
“请 讲 ……” (教师 发 出 的 这 个 报 文 鼓励 你 提出 问题 ， 教 师 喜 欢 被 问 问题 .) 接着 你 就 问 
了 问题 ( 向 该 教师 传输 了 你 的 报 文 )。 教 师 听 取 了 你 的 问题 (接收 了 你 的 问题 报 文 ) 并 
加 以 回答 (向 你 传输 了 回答 报 文 )。 我 们 再 一 次 看 到 了 报 文 的 发 送 和 接收 ， 以 及 这 些 报 
文 发 送 和 接收 时 所 采取 的 一 系列 约定 俗 成 的 动作 ， 这些 是 这 个 “提问 与 回答 ”协议 的 
关键 所 在 。 

2. 网 络 协 议 


网 络 协 议 类 似 于 人 类 协议 ， 除 了 交换 报 文 和 采取 动作 的 实体 是 某 些 设备 (可 以 是 计算 
机 、 智 能 手机 、 平 板 电脑 、 路 由 器 或 其 他 具有 网 络 能 力 的 设备 ) 的 硬件 或 软件 组 件 。 在 因 
特 网 中 ， 涉 及 两 个 或 多 个 远程 通信 实体 的 所 有 活动 都 受 协 议 的 制约 。 例 如 ， 在 两 台 物理 上 
连接 的 计算 机 中 ， 硬 件 实现 的 协议 控制 了 在 两 块 网 络 接口 卡 间 的 “ 线 上 ”的 比特 流 ; 在 端 
系统 中 ， 拥 塞 控 制 协议 控制 了 在 发 送 方 和 接收 方 之 间 传 输 的 分 组 发 送 的 速率 ; 路 由 器 中 的 
协议 决定 了 分 组 从 源 到 目的 地 的 路 径 。 在 因特网 中 协议 运行 无 处 不 在 ， 因 此 本 书 的 大 量 篇 
幅 都 与 计算 机 网 络 协 议 有 关 。 

以 大 家 可 能 熟悉 的 一 个 计算 机 网 络 协议 为 例 ， 考 虑 当 你 向 一 个 Web 服务 器 发 出 请 求 
( 即 你 在 Web 浏览 器 中 键入 一 个 Web 网 页 的 URL) 时 所 发 生 的 情况 。 图 1-2 右 半 部 分 显示 
了 这 种 情形 。 首 先 ， 你 的 计算 机 将 向 该 Web 服务 器 发 送 一 条 连接 请 求 报 文 ， 并 等 待 回 答 。 
该 Web 服务 器 将 最 终 能 接收 到 连接 请 求 报 文 ， 并 返回 一 条 连接 响应 报 文 。 得 知 请 求 该 
Web 文档 正常 以 后 ， 计 算 机 则 在 一 条 GET 报 文 中 发 送 要 从 这 台 Web 服务 器 上 取 回 的 网 页 
名 字 。 最 后 ，Web 服务 器 回 计 算 机 返回 该 Web 网 页 (文件 ) 。 

从 上 述 的 人 类 活动 和 网 络 例子 中 可 见 ， 报 文 的 交换 以 及 发 送 和 接收 这 些 报 文 时 所 采取 
的 动作 是 定义 一 个 协议 的 关键 元 素 : 

协议 (protocol) 定义 了 在 两 个 或 多 个 通信 实体 之 间 交 换 的 报 文 的 格式 和 顺 

序 ， 以 及 报 文 发 送 和 /或 接收 一 条 报 文 或 其 他 事件 所 采取 的 动作 。 

因特网 (更 一 般 地 说 是 计算 机 网 络 ) 广泛 地 使 用 了 协议 。 不 同 的 协议 用 于 完成 不 同 的 
通信 任务 。 当 你 阅读 完 这 本 书后 将 会 知道 ， 某 些 协议 简单 而 直截了当 ， 而 某 些 协议 则 复杂 
且 星 梁 难 懂 。 掌 握 计 算 机 网 络 领域 知识 的 过 程 就 是 理解 网 络 协议 的 构成 、 原 理 和 工作 方式 
的 过 程 。 


1.2 网 络 边缘 


在 上 一 节 中 ,我们 给 出 了 因特网 和 网 络 协议 的 总 体 概述 。 现 在 我 们 将 更 深入 一 些 来 探 
究 计 算 机 网 络 (特别 是 因特网 ) 的 部 件 。 在 本 节 中 ， 我 们 从 网 络 边 缘 开 始 ， 观 察 一 下 我 们 
更 为 熟悉 的 部 件 ， 即 我 们 日 常 使 用 的 计算 机 、 智 能 手机 和 其 他 设备 。 在 接 下 来 的 一 节 中 ， 
我 们 将 从 网 络 边缘 向 网 络 核 心 推 进 ， 查 看 计算 机 网 络 中 的 交换 和 选 路 。 
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回想 前 一 节 中 计算 机 网 络 的 术语 ， 通 党 把 与 因特网 相连 的 计算 机 和 其 他 设备 称 为 端 系 
统 。 如 图 1-3 所 示 ， 因 为 它们 位 于 因特网 的 边缘 ， 故 而 被 称 为 端 系统 。 因 特 网 的 端 系统 包 
括 了 桌面 计算 机 (例如 ， 桌面 PC、Mac 和 Linux 设备 ) 、 服 务 器 (例如 ，Web 和 电子 邮件 
服务 器 ) 和 移动 计算 机 (例如 ,便携 机 、 智 能 手机 和 平板 电脑 )。 此 外 ， 越 来 越 多 的 非 传 
统 物品 正 被 作为 端 系统 与 因特网 相连 (参见 “历史 事件 ” )。 


== a Ts 
Pe” E , 一 i 5 
一 上 i Toy 
| | 





1-3 ” 端 系统 交互 


端 系统 也 称 为 主机 ( host) ， 因 为 它们 容纳 ( 即 运行 ) 应 用 程序 ， 如 Web 浏览 器 程 
序 、Web 服务 器 程序 、 电 子 邮件 客户 程序 或 电子 邮件 服务 器 程序 等 。 本 书 通 篇 将 交替 使 
用 主机 和 端 系统 这 两 个 术语 ， 即 主机 = 端 系统 。 主 机 有 时 又 被 进一步 划分 为 两 类 : 客户 
(client) 和 服务 器 (server), APG ERA PC. Ba PC 和 智能 手机 等 ， 而 服务 器 通 
常 是 更 为 强大 的 机 器 ， 用 于 存储 和 发 布 Web 页 面 、 流 视频 、 中 继 电 子 邮件 等 。 今天， 
大 部 分 提供 搜索 结果 、 电 子 邮件 、Web 页 面 和 视频 的 服务 器 都 属于 大 型 数据 中 心 (data 
center) 。 例 如 ， 谷 歌 公司 (Google) 拥有 50 ~ 100 个 数据 中 心 ， 其 中 15 个 大 型 数据 中 
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心 每 个 都 有 10 万 台 以 上 的 服务 器 。 


物 联 网 | 
你 能 够 想象 几乎 每 样 东 西 都 与 因特网 无 线 连 接 的 一 个 世界 吗 ? 能 够 想象 在 这 个 世界 
上 连接 了 大 多 数 人 人、 汽车、 自行车、 眼镜、 手表 、 玩 具 、 医 疗 设备 、 家 用 传感器 、 教 
室 、 视 频 监 视 系统 、 大 气 传 感 器 、 陈 列 架 产品 和 宠物 吗 ? 这 种 物 联网 (Internet of 
Things, IoT) 事实 上 就 在 不 远 的 某 处 。 
据 估 计 ， 在 2015 年 有 50 亿 件 物品 连接 到 因特网 ， 到 了 2020 年 该 数字 能 够 达到 250 
亿 [Gartner 2014]。 这 些 物品 包括 我 们 的 智能 手机 ， 它 已 经 跟随 我 们 遍及 我 们 的 家 庭 、 
办 公 室 和 汽车 ， 向 ISP 和 因特网 应 用 程序 报告 我 们 的 地 理 位 置 和 使 用 数据 。 而 除了 智能 
手机 ， 各 种 各 样 的 非 传 统 “ 物 品 ” 也 已 经 作为 产品 可 供 使 用 。 例 如 ， 有 因特网 连接 的 可 
穿戴 设备 ， 包 括 手表 (来 自 草 果 和 许多 其 他 生产 商 ) 和 眼镜 。 因 特 网 连接 的 眼镜 能 够 将 
我 们 看 到 的 每 样 东西 上 载 到 云端 ， 允 许 我 们 与 世界 各 地 的 人 们 实时 共享 我 们 的 视觉 体 
验 。 对 于 智能 家 居 ， 有 因特网 连接 的 物品 ， 包 括 恒 温 调 节 器 (能够 通过 智能 手机 远程 控 
制 ) 以 及 人 体 种 《能 够 通过 惫 能 手机 以 图 形 化 方式 审查 我 们 的 饮食 ) 。 有 四 特 网 连接 的 | 
玩具 ， 包 括 识别 和 解释 孩子 讲话 并 适当 地 进行 响应 的 玩偶 。 
物 联 网 给 用 户 带 来 了 革命 性 的 潜在 好 处 。 但 与 此 同时 ， 也 存在 巨大 的 安全 风险 和 隐 | 
私 风险 。 例 如 ， 攻 击 者 可 能 能 够 通过 因特网 入 侵 物 联网 设备 或 服务 器 ， 以 收集 来 自 物 联 
网 设备 的 数据 。 例 如 ， 攻 击 者 能 够 动 持 一 个 与 因特网 连接 的 玩偶 并 直接 与 孩子 交谈 ,或 | 
者 能 够 入 侵 存 储 个 人 健康 或 活动 信息 的 数据 库 ， 这 些 信息 来 自 可 穿戴 设备 。 这 些 安 全 和 
隐私 问题 可 能 会 使 消费 者 渐渐 地 失去 信心 ， 并 可 能 导致 消费 者 的 广泛 接受 程度 下 降 
[FTC 2015], | 








1.2.1 接 入 网 


考虑 了 位 于 “网 络 边缘 ”的 应 用 程序 和 端 系 统 后 ， 我 们 接 下 来 考虑 接 入 网 ， 这 是 指 将 
端 系统 物理 连接 到 其 边缘 路 由 器 (edge router) 的 网 络 。 边 缘 路 由 器 是 端 系统 到 任何 其 他 
远程 端 系统 的 路 径 上 的 第 一 台 路 由 器 。 图 1-4 用 粗 的 、 带 阴影 的 线 显示 了 几 种 类 型 的 接 人 
链 路 和 使 用 接 人 网 的 几 种 环境 〈 家 庭 、 公 司 和 广 域 移 动 无 线 ) 。 

1. 家 庭 接 人 : DSL、 电 缆 、FTTH、 拨 写 和 卫星 

2014 年 ， 在 发 达 国 家 中 ， 实 现 因特网 接 人 的 家 庭 超 过 78% , BATA ASR. toy ~~ 
芬兰 和 瑞典 实现 因特网 接 人 的 家 庭 则 超过 80% ， 几 乎 所 有 家 庭 都 是 经 过 高 速 宽带 连接 
[ITU 2015 ] 。 考 虑 到 家 庭 对 网 络 接 人 的 强烈 兴趣 ， 我 们 从 家 庭 与 因特网 的 连接 开始 介绍 接 
人 网 概况 。 

今天 ， 宽 带 住宅 接 人 有 两 种 最 流行 的 类 型 : 数字 用 户 线 (Digital Subscriber Line, 
DSL) 和 电缆 。 住 户 通常 从 提供 本 地 电话 接 人 的 本 地 电话 公司 处 获得 DSL 因特网 接 入 。 因 
此 ， 当 使 用 DSL 时 ， 用 户 的 本 地 电话 公司 也 是 它 的 BSP。 如 图 1-5 所 示 ， 每 个 用 户 的 DSL 
调制 解 调 器 使 用 现 有 的 电话 线 〈 即 双 绞 铜 线 ， 将 在 1. 2. 2 节 中 讨论 它 ) 与 位 于 电话 公司 的 
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本 地 中 心 局 (C0) 中 的 数字 用 户 线 接 入 复 用 器 (DSLAM) 交换 数据 。 家 庭 的 DSL 调制 解 
调 器 得 到 数字 数据 后 将 其 转换 为 高 频 音 ， 以 通过 电话 线 传 输 给 本 地 中 心 局 ; 来 自 许多 家 庭 
的 模拟 信号 在 DSLAM 处 被 转换 回 数字 形式 。 





Af 


图 1-4 AW 


家 庭 电话 现 有 电话 线 : 
WN 0~4kHz 为 电话 ; 4~50kHz 
~< 为 上 行 数 据 ; 50kHz~1MHz 
为 下 行 数据 
分 配器 


DSL 调 制 解 调 器 中 心 局 





Al 1-5 DSL 因特网 接 人 


家 庭 电 话 线 同时 承载 了 数据 和 传统 的 电话 信号 ， 它 们 用 不 同 的 频率 进行 编码 : 

。 高 速 下 行 信道 ， 位 于 50kHz 到 1MHz 频段 ; 

e 中 速 上 行 信 道 ， 位 于 4kHz 到 50kHz 频段 ; 

e 普通 的 双向 电话 信道 ， 位 于 0 到 4kHz 频段 。 

这 种 方法 使 单 根 DSL 线路 看 起 来 就 像 有 3 根 单独 的 线路 一 样 ， 因 此 一 个 电话 呼叫 和 一 
个 因特网 连接 能 够 同时 共享 DSL 链 路 。 (1.3.1 节 将 描述 这 种 频 分 复 用 技术 。) 在 用 户 一 
侧 ， 一 个 分 配器 把 到 达 家 庭 的 数据 信号 和 电话 信和 号 分 隔 开 ， 并 将 数据 信和 号 转发 给 DSL 调制 
解 调 器 。 在 电话 公司 一 侧 ， 在 本 地 中 心 局 中 ，DSLAM 把 数据 和 电话 信和 号 分 隔 开 ， 并 将 数 
据 送 往 因 特 网 。 数 百 甚至 上 千 个 家 庭 与 同一 个 DSLAM 相连 [ Dischinger 2007 ] 。 

DSL 标准 定义 了 多 个 传输 速率 ， 包括 12Mbps 下 行 和 1.8Mbps 上 行 传输 速率 [ITU 
1999], LIK 55Mbps 下 行 和 15Mbps 上 行 传输 速率 [ITU 2006 ] 。 因 为 这 些 上 行 速 率 和 下 行 
速率 是 不 同 的 ， 所 以 这 种 接 人 被 称 为 是 不 对 称 的 。 实 际 取得 的 下 行 和 上 行 传输 速率 也 许 小 
于 上 述 速率 ， 因 为 当 DSL 提供 商 提供 分 等 级 的 服务 (以 不 同 的 价格 使 用 不 同 的 速率 ) 时 ， 
他 们 也 许 有 意 地 限制 了 住宅 速率 ， 或 者 因为 家 庭 与 本 地 中 心 局 之 间 的 距离 、 双 绞 线 的 规格 
和 电气 干扰 的 程度 而 使 最 大 速率 受 限 。 工 程 师 特别 为 家 庭 与 本 地 中 心 局 之 间 的 短 距离 接 入 
设计 了 DSL; 一 般 而 言 ， 如 果 住 宅 不 是 位 于 本 地 中 心 局 的 5~10 英里 (1 英里 =1609. 344 
X) 范围 内 ， 该 住宅 必须 采用 其 他 形式 的 因特网 接 人 。 

DSL 利用 电话 公司 现 有 的 本 地 电话 基础 设施 ， 而 电缆 因特网 接 入 (cable Internet access) 
利用 了 有 线 电视 公司 现 有 的 有 线 电视 基础 设施 。 住 宅 从 提供 有 线 电视 的 公司 获得 了 电缆 因 特 
网 接 入 。 如 图 1-6 所 示 ， 光 缆 将 电缆 头 端 连接 到 地 区 枢纽 ， 从 这 里 使 用 传统 的 同 轴 电 缆 到 达 
各 家 各 户 和 公寓 。 每 个 地 区 枢纽 通常 支持 500 ~ 5000 个 家 庭 。 因 为 在 这 个 系统 中 应 用 了 光纤 
和 同 轴 电 缆 ， 所 以 它 经 常 被 称 为 混合 光纤 同 轴 (Hybrid Fiber Coax, HFC) 系统 。 
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图 1-6 一 个 混合 光纤 同 轴 接 入 网 


电费 因特网 接 和 人 需要 特殊 的 调制 解 调 器， 这 种 调制 解 调 需 称 为 电缆 调制 解 调 器 (cable 
modem) 。 如 同 DSL 调制 解 调 舌 ， 电 缆 调 制 解 调 器 通常 是 一 个 外 部 设备 ， 通 过 一 个 以 太 网 
端口 连接 到 家 庭 PC。 (我们 将 在 第 6 章 非 常 详细 地 讨论 以 太 网 。) 在 电缆 头 端 ， 电 缆 调 制 
解 调 器 端 接 系统 (Cable Modem Termination System, CMTS) 与 DSL 网 络 的 DSLAM 具有 类 
似 的 功能 ， 即 将 来 自 许 多 下 行家 庭 中 的 电缆 调制 解 调 器 发 送 的 模拟 信号 转换 回 数字 形式 。 
电缆 调制 解 调 需 将 HFC 网 络 划 分 为 下 行 和 上 行 两 个 信道 。 如 同 DSL， 接 入 通常 是 不 对 称 
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的 ， 下 行 信道 分 配 的 传输 速率 通常 比 上 行 信道 的 高 。D0OCSIS 2.0 标准 定义 了 高 达 
42. 8Mbps 的 下 行 速 率 和 高 达 30.7Mbps 的 上 行 速 率 。 如 在 DSL 网 络 中 的 情况 那样 ， 由 于 较 
低 的 合同 数据 率 或 媒体 损耗 ， 可 能 不 一 定 能 达到 最 大 可 取得 的 速率 。 

电缆 因特网 接 入 的 一 个 重要 特征 是 共享 广播 媒体 。 特 别 是 ， 由 头 端 发 送 的 每 个 分 组 问 
下 行经 每 段 链 路 到 每 个 家 庭 ; 每 个 家 庭 发 送 的 每 个 分 组 经 上 行 信道 向 头 端 传输 。 因 此 ， 如 
果 几 个 用 户 同 时 经 下 行 信道 下 载 一 个 视频 文件 ， 每 个 用 户 接 收视 频 文件 的 实际 速率 将 大 大 
低 于 电缆 总 计 的 下 行 速 率 。 而 另 一 方面 ， 如 果 仅 有 很 少 的 活跃 用 户 在 进行 Web 冲浪 ， 则 
每 个 用 户 都 可 以 以 全 部 的 下 行 速率 接收 Web 网 页 ， 因 为 用 户 们 很 少 在 完全 相同 的 时 刻 请 
求 网 页 。 因 为 上 行 信道 也 是 共享 的 ， 需 要 一 个 分 布 式 多 路 访问 协议 来 协调 传输 和 避免 碰 
i. (RIKER 6 章 中 更 为 详细 地 讨论 碰撞 问题 。) 

尽管 DSL 和 电缆 网 络 当前 代表 了 超过 85% 的 美国 住宅 宽带 接 人 ， 但 一 种 提供 更 高 速 
率 的 新 兴 技 术 是 光纤 到 户 (Fiber To The Home, FTTH) [FTTH Council 2016 ] 。 顾 名 思 义 ， 
FTTH 概念 简单 ， 从 本 地 中 心 局 直接 到 家 庭 提供 了 一 条 光纤 路 径 。 现 在 ， 许 多 国家 或 地 区 ， 
包括 阿拉 伯 联 合 商 长 国 、 韩 国 、 中 国 香港 、 日 本 、 新 加 坡 、 中 国 台湾 、 立 陶 匈 和 瑞典 ， 人 和 人 
户 率 已 经 超过 了 30% | FTTH Council 2016 ] 。 

从 本 地 中 心 局 到 家 庭 有 几 种 有 竞争 性 的 光纤 分 布 方案 。 最 简单 的 光纤 分 布 网 络 称 为 直 
接 光 纤 ， 从 本 地 中 心 局 到 每 户 设置 一 根 光 纤 。 更 为 一 般 的 是 ， 从 中 心 局 出 来 的 每 根 光纤 实 
际 上 由 许多 家 庭 共享 ， 直 到 相对 接近 这 些 家 庭 的 位 置 ， 该 光纤 才 分 成 每 户 一 根 光 纤 。 进 行 
这 种 分 配 有 两 种 有 竞争 性 的 光纤 分 布 体系 结构 : 主动 光纤 网 络 (Active Optical Network, 
AON) 和 被 动 光 纤 网 络 (Passive Optical Network, PON), AON 本 质 上 就 是 交换 因特网 ， 
我 们 将 在 第 6 章 讨 论 它 。 

这 里 ， 我 们 简要 讨论 一 下 PON ， 该 技术 用 于 Verizon 的 FIOS 服务 中 。 图 1-7 显示 了 使 
用 PON 分 布 体系 结构 的 FTTH。 每 个 家 庭 具 有 一 个 光纤 网 络 端 接 器 (Optical Network Termi- 
nator，ONT) ， 它 由 专门 的 光纤 连接 到 邻近 的 分 配器 (splitter) 。 该 分 配器 把 一 些 家 庭 〈( 通 
HDF 100 +) 集结 到 一 根 共享 的 光纤 ， 该 光纤 再 连接 到 本 地 电话 和 公司 的 中 心 局 中 的 光 
纤 线 路 端 接 器 ( Optical Line Terminator，OLT) 。 该 OLT 提供 了 光 信 和 号 和 电信 和 号 之 间 的 转 
换 ， 经 过 本 地 电话 公司 路 由 器 与 因特网 相连 。 在 家 庭 中 ， 用 户 将 一 台 家 庭 路 由 器 (通常 是 
无 线路 由 器 ) 与 ONT 相连 ， 并 经 过 这 人 台 家 庭 路 由 器 接 人 因特网 。 在 PON 体系 结构 中 ， 所 
有 从 OLT 发 送 到 分 配器 的 分 组 在 分 配器 〈 类 似 于 一 个 电缆 头 端 ) 处 复制 。 





图 1-7 FTTH 因特网 接 入 
FTTH 有 潜力 提供 每 秒 千 兆 比特 范围 的 因特网 接 人 速率 。 然 而 ， 大 多 数 FTTH ISP 提供 
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多 种 不 同 速率 选择 ， 较 高 的 速率 目 然 花 费 更 多 。 美 国 FTTH 用 户 在 2011 年 的 平均 下 行 速率 
大 约 为 20Mbps (5 13Mbps 电缆 接 入 网 相当 ， 而 小 于 5Mbps DSL) [FTTH Council 2011b ] 。 

还 可 采用 另外 两 种 接 人 网 技术 为 家 庭 提 供 因 特 网 接 人 。 在 无 法 提供 DSL、 电 缆 和 
FTTH 的 地 方 〈 例 如 在 某 些 乡村 环境 ) ， 能 够 使 用 卫星 链 路 将 住宅 以 超过 1Mbps 的 速率 与 
因特网 相连 。StarBand 和 HughesNet 是 两 家 这 样 的 卫星 接 人 提供 商 。 使 用 传统 电话 线 的 拨 
号 接 人 与 DSL 基于 相同 的 模式 : 家 庭 的 调制 解 调 堪 经 过 电话 线 连接 到 ISP 的 调制 解 调 器 。 
与 DSL 和 其 他 宽带 接 人 网 相 比 ， 拨 号 接 人 56kbps 的 慢 速率 是 令 人 痛苦 的 。 

2. 企业 (MRE) HA: UKWA WiFi 


PEAT EE E UAA ETE E ERED 使 用 局 域 网 (LAN) 将 端 系统 连接 到 
边缘 路 由 器 。 尽 管 有 许多 不 同类 型 的 
局 域 网 技术 ,但 是 以 太 网 到 目前 为 止 
是 公司 、 大 学 和 家 庭 网 络 中 最 为 流行 
的 接 人 技术 。 如 图 1-8 中 所 示 ， 以 太 
网 用 户 使 用 双 绞 铜 线 与 一 台 以 太 网 交换 
机 相连 ,第 6 章 中 将 详细 讨论 该 技术 。 





以 太 网 交换 机 或 这 样 相连 的 交换 机 网 

络 ， 则 再 与 更 大 的 因特网 相连 。 使 用 以 

AM # A, FA i LA 100Mbps 或 服务 器 

1Gbps 速率 接 人 以 太 网 交换 机 ， 而 服务 图 1-8 LAMAR RA 


器 可 能 具有 1Gbps 甚至 10Gbps 的 接 人 速率 。 

然而 ， 越 来 越 多 的 人 从 便携 机 、 智 能 手机 、 平 板 电脑 和 其 他 物品 无 线 接 人 因特网 (SB 
见 前 面 的 插入 内 容 “ 物 联网 ”) 。 在 无 线 LAN 环境 中 ， 无 线 用 户 从 /到 一 个 接 人 点 发 送 / 接 
收 分 组 ， 该 接 人 点 与 企业 网 连接 (很 可 能 使 用 了 有 线 以 太 网 ) ， 企 业 网 再 与 有 线 因 特 网 相 
连 。 一 个 无 线 LAN 用 户 通 常 必须 位 于 接 入 点 的 几 十 米 范 围 内 。 基 于 IEEE 802. 11 技术 的 无 
线 LAN 接 人 ， 更 通俗 地 称 为 WiFi， 目 前 几乎 无 所 不 在 ， 如 大 学 、 商 业 办 公 室 、 咖 啡 厅 、 
机 场 、 家 庭 ， 甚 至 在 飞机 上 。 在 许多 城市 ， 人 们 能 够 站 在 街头 而 位 于 10 或 20 个 基站 范围 
内 (对 于 可 浏览 的 802. 11 基站 全 局 图 ， 参 见 [ wigle. net 2016 ] ， 这 些 基 站 由 那些 非常 热心 
做 这 种 事情 的 人 发 现 并 记载 在 Web 站 点 上 ) 。 如 在 第 7 章 详细 讨论 的 那样 ，802. 11 今天 提 
供 了 高 达 100Mbps 的 共享 传输 速率 。 

虽然 以 太 网 和 WiFi 接 人 网 最 初 是 设置 在 企业 (公司 或 大 学 ) 环境 中 的 ， 但 它们 近来 
已 经 成 为 家 庭 网 络 中 相当 常见 的 部 件 。 今 天 许多 家 庭 将 宽带 住宅 接 人 (〈 即 电缆 调制 解 调 器 
或 DSL) 与 廉价 的 无 线 局 域 网 技术 结合 起 来 ， 以 产生 强大 的 家 用 网 络 [Edwards 2011 ] 。 图 
1-9 显示 了 典型 的 家 庭 网 络 。 这 个 家 庭 网 络 组 成 如 下 : 一 台 漫游 的 便携 机 和 一 台 有 线 PC; 一 
个 与 无 线 PC 和 家 中 其 他 无 线 设 备 通信 的 基站 (无 线 接 入 点 ); 一 个 提供 与 因特网 宽带 接 人 的 
电缆 调制 解 调 器 ; 一 台 互 联 了 基站 及 带 有 电缆 调制 解 调 器 的 固定 PC 的 路 由 器 。 该 网 络 允 许 
家 庭 成 员 经 宽带 接 人 因特网 ， 其 中 任何 一 个 家 庭 成 员 都 可 以 在 厨房 、 院 子 或 卧室 漫游 上 网 。 

3. 广 域 无 线 接 人 : 3G Al LTE 


iPhone 和 安 蛙 等 设备 越 来 越 多 地 用 来 在 移动 中 发 信息 、 在 社交 网 络 中 分 享 照片 、 观 看 
视频 和 放 音 乐 。 这 些 设备 应 用 了 与 蜂 窜 移动 电话 相同 的 无 线 基 础 设施 ， 通 过 蜂窝 网 提供 商 
运营 的 基站 来 发 送 和 接收 分 组 。 与 WiFi 不 同 的 是 ， 一 个 用 户 仅 需要 位 于 基站 的 数 万 米 
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(而 不 是 几 十 米 ) 范围 内 。 





图 1-9 一 个 典型 的 家 庭 网 络 的 示意 图 


电信 公司 已 经 在 所 谓 第 三 代 (3G) 无 线 技术 中 进行 了 大 量 投资 ，36 为 分 组 交换 广 域 
无 线 因 特 网 接 人 提供 了 超过 1Mbps 的 速率 。 甚 至 更 高 速率 的 广 域 接 人 技术 即 第 四 代 〈4G ) 
广 域 无 线 网 络 也 已 经 被 部 署 了 。LIE (长 期 演进 “Long- Term Evolution” 的 缩写 ， 被 评 为 
最 差 首 字母 缩写 词 年 度 奖 候选 者 ) 来 源 于 3G 技术 ， 它 能 够 取得 超过 10Mbps 的 速率 。 据 
报道 ， 几 十 Mbps 的 LTE 下 行 速率 已 经 在 商业 部 署 中 得 到 应 用 。 我 们 将 在 第 7 章 讨论 无 线 
网 络 和 移动 性 ， 以 及 WiFi, 3G A LTE 等 技术 的 基本 原则 。 


1.2.2 物理 媒体 


在 前 面 的 内 容 中 ,我们 概述 了 因特网 中 某 些 最 为 重要 的 网 络 接 入 技术 。 当 我 们 描述 
这 些 技术 时 ， 我们 也 指出 了 所 使 用 的 物理 媒体 。 例 如 ， 我 们 说 过 HPC 使 用 了 光缆 和 同 
轴 电 缆 相 结合 的 技术 。 我 们 说 过 DSL 和 以 太 网 使 用 了 双 绞 铜 线 。 我 们 也 说 过 移动 接 入 网 
使 用 了 无 线 电 频 谱 。 在 这 一 节 中 ， 我 们 简要 概述 一 下 这 些 和 其 他 常 在 因特网 中 使 用 的 传 
输 媒 体 。 

为 了 定义 物理 媒体 所 表示 的 内 容 ， 我 们 仔细 思考 一 下 一 个 比特 的 短暂 历程 。 考 虑 一 个 
比特 从 一 个 端 系统 开始 传输 ， 通 过 一 系列 链 路 和 路 由 器 ， 到 达 另 一 个 端 系统 。 这 个 比特 被 
漫不经心 地 传输 了 许 许多 多 次 ! 源 端 系统 首先 发 射 这 个 比特 ， 不 和 久 后 其 中 的 第 一 台 路 由 顺 
接收 该 比特 ; 第 一 台 路 由 需 发 射 该 比特 ， 接 着 不 久 后 第 二 人 台 路 由 顺 接 收 该 比特 ; 等 等 。 因 
此 ， 这 个 比特 当 从 源 到 目的 地 传输 时 ， 通 过 一 系列 “发 射 器 -接收 器 ”对 。 对 于 每 个 发 射 
dr -接收 占 对 ， 通 过 跨越 一 种 物理 媒体 (physical medium) 传播 电磁 波 或 光 脉 冲 来 发 送 该 
比特 。 该 物理 媒体 可 具有 多 种 形状 和 形式 ， 并 且 对 沿途 的 每 个 发 射 器 -接收 器 对 而 言 不 必 
具有 相同 的 类 型 。 物 理 媒体 的 例子 包括 双 绞 钢 线 、 同 轴 电 缆 、 多 模 光 纤 缆 、 陆 地 无 线 电 频 
谱 和 卫星 无 线 电 频 谱 。 物 理 媒 体 分 成 两 种 类 型 . 导 引 型 媒体 (guided media) 和 非 导 引 型 
媒体 (unguided media) 。 对 于 导 引 型 媒体 ， 电 波 沿 着 固体 媒体 前 行 ， 如 光 绕 、 双 绞 铜 线 或 
同 轴 电 绕 。 对 于 非 导 引 型 媒体 ， 电 波 在 空气 或 外 层 空间 中 传播 ， 例 如 在 无 线 局 域 网 或 数字 
卫星 频道 中 。 

在 深入 讨论 各 种 媒体 类 型 的 特性 之 前 ,我 们 简要 地 讨论 一 下 它们 的 成 本 。 物 理 链 路 
(HR. AAE) 的 实际 成 本 与 其 他 网 络 成 本 相 比 通常 是 相当 小 的 。 特 别 是 安装 物理 链 路 
的 劳动 力 成 本 能 够 比 材料 的 成 本 高 出 几 个 数量 级 。 正 因为 这 个 原因 ， 许 多 建筑 商 在 一 个 建 
筑 物 的 每 个 房间 中 安装 了 双 绞 线 、 光 缆 和 同 轴 电缆 。 即 使 最 初 仅 使 用 了 一 种 媒体 ， 在 不 入 
的 将 来 也 可 能 会 使 用 另 一 种 媒体 ， 这 样 将 来 不 必 再 铺设 另外 的 线 缆 ， 从 而 节省 了 经 费 。 


1. WBE 


最 便宜 并 且 最 常用 的 导 引 型 传输 媒体 是 双 绞 铜 线 。 一 百 多 年 来 ， 它 一 直 用 于 电话 网 。 
事实 上 ， 从 电话 机 到 本 地 电话 交换 机 的 连 线 超过 99% 使 用 的 是 双 绞 铜 线 。 我 们 多 数 人 在 自 
己 家 中 和 工作 环境 中 已 经 看 到 过 双 绞 线 。 双 绞 线 由 两 根 绝缘 的 铜 线 组 成 ， 每 根 大 约 1mm 
粗 ， 以 规则 的 螺旋 状 排 列 着 。 这 两 根 线 被 绞 合 起 来 ， 以 减少 邻近 类 似 的 双 绞 线 的 电气 干 
扰 。 通 常 许多 双 绞 线 捆扎 在 一 起 形成 一 根 电 绕 ， 并 在 这 些 双 绞 线 外 面 履 盖 上 保护 性 防护 
层 。 一 对 电线 构成 了 一 个 通信 链 路 。 无 屏蔽 双 绞 线 ( Unshielded Twisted Pair, UTP) 常用 
在 建筑 物 内 的 计算 机 网 络 中 ， 即 用 于 局 域 网 (LAN) 中 。 目 前 局 域 网 中 的 双 绞 线 的 数据 速 
率 从 10Mbps 到 10Cbps。 所 能 达到 的 数据 传输 速率 取决 于 线 的 粗细 以 及 传输 方 和 接收 方 之 
间 的 距离 。 

20 世纪 80 年 代 出 现 光 纤 技 术 时 ,许多 人 因为 双 绞 线 比 特 速 率 低 而 轻视 它 ， 某 些 人 其 
至 认为 光纤 技术 将 完全 代替 双 绞 线 。 但 双 绞 线 不 是 那么 容易 被 抛弃 的 。 现 代 的 双 绞 线 技术 
例如 6a 类 电缆 能 够 达到 10Gbps 的 数据 传输 速率 ， 距 离 长 达 100m。 双 绞 线 最 终 已 经 作为 
高 速 LAN 联网 的 主导 性 解决 方案 。 

如 前 面 讨 论 的 那样 ， 双 绞 线 也 经 党 用 于 住宅 因特网 接 人 。 我 们 看 到 ， 拨 号 调制 解 调 顺 技 
术 通 过 双 绞 线 能 以 高 达 56kbps 的 速率 接 入 。 我 们 也 看 到 ， 数 字 用 户 线 (DSL) ARM 
线 使 住宅 用 户 以 超过 数 十 Mbps 的 速率 接 人 因特网 〈 当 用 户 靠近 ISP 的 中 心 局 居住 时 ) 。 

2. 同 轴 电线 

与 双 绞 线 类 似 ， 同 轴 电 绕 由 两 个 铜 导 体 组 成 ,但 是 这 两 个 导体 是 同心 的 而 不 是 并 行 
的 。 借 助 于 这 种 结构 及 特殊 的 绝缘 体 和 保护 层 ， 同 轴 电 缆 能 够 达到 较 高 的 数据 传输 速 
率 。 同 轴 电 缆 在 电缆 电视 系统 中 相当 普遍 。 我 们 前 面 已 经 看 到 ， 电 缆 电 视 系统 最 近 与 电 
缆 调 制 解 调 器 结合 起 来 ， 为 住宅 用 户 提 供 数 十 Mbps 速率 的 因特网 接 和 人 人。 在 电缆 电视 和 
电缆 因特网 接 人 中 ， 发 送 设备 将 数字 信和 号 调制 到 某 个 特定 的 频段 ， 产 生 的 模拟 信号 从 发 
送 设备 传送 到 一 个 或 多 个 接收 方 。 同 轴 电 缆 能 被 用 作 导 引 型 共享 媒体 (shared medium) 。 
特别 是 ， 许 多 端 系统 能 够 直接 与 该 电缆 相连 ， 每 个 端 系统 都 能 接收 由 其 他 端 系 统 发 送 的 
内 容 。 

3. 光纤 

光纤 是 一 种 细 而 柔软 的 、 能 够 导 引 光 脉 冲 的 媒体 ， 每 个 脉冲 表示 一 个 比特 。 一 根 光 
纤 能 够 支持 极 高 的 比特 速率 ， 高 达 数 十 甚至 数理 Cbps。 它 们 不 受 电磁 干扰 ， 长 达 100km 
的 光缆 信号 衰减 极 低 ， 并 且 很 难 窃听 。 这 些 特 征 使 得 光纤 成 为 长 途 导 引 型 传输 媒体 ， 特 
别 是 跨 海 链 路 。 在 美国 和 别 的 地 方 ， 许 多 长 途 电话 网 络 现在 全 面 使 用 光纤 。 光 纤 也 广泛 
用 于 因特网 的 主干 。 然 而 ， 高 成 本 的 光 设 备 ， 如 发 射 咽 、 接 收 胡 和 交换 机 ， 阻 碍 光纤 在 
短途 传输 中 的 应 用 ， 如 在 LAN 或 家 庭 接 入 网 中 就 不 使 用 它们 。 光 载波 (Optical Carrier, 
OC) 标准 链 路 速率 的 范围 从 51.8Mbps 到 39. 8Gbps; 这 些 标 准 常 被 称 为 0C-n， 其 中 的 
链 路 速率 等 于 nx51.8Mbps。 目 前 正在 使 用 的 标准 包括 0C-1、0C-3、0C-12、0C-24、 
0C-48 、0C-96 、0C-192 、0C-768。[ Mukherjee 2006; Ramaswami 2010] 提供 了 光纤 网 
络 各 方面 的 知识 。 


4. 陆地 无 线 电信 道 
无 线 电信 道 承载 电磁 频谱 中 的 信号 。 它 不 需要 安装 物理 线路 ， 并 具有 穿 透 墙壁 、 提 供 
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与 移动 用 户 的 连接 以 及 长 距离 承载 信号 的 能 力 ， 因 而 成 为 一 种 有 吸引 力 的 媒体 。 无 线 电信 
道 的 特性 极 大 地 依赖 于 传播 环境 和 信号 传输 的 距离 。 环 境 上 的 考虑 取决 于 路 径 损 耗 和 遮挡 
eR ( 即 当 信号 跨 距离 传播 和 绕 过 /通过 阻碍 物体 时 信号 强度 降低 )、 多 径 衰 落 (由 于 干 
扰 对 象 的 信号 反射 ) 以 及 干扰 (由 于 其 他 传输 或 电磁 信号 )。 

陆地 无 线 电信 道 能 够 大 致 划分 为 三 类 : 一 类 运行 在 很 短 距离 (如 1 米 或 2 米 ); 另 一 
类 运行 在 局 域 ， 通 常 跨越 数 十 到 几 百 米 ; 第 三 类 运行 在 广 域 ， 跨 越 数 万 米 。 个 人 设备 如 无 
线头 戴 式 耳机 、 键 盘 和 医疗 设备 跨 短 距离 运行 ; 在 1.2.1 节 中 描述 的 无 线 LAN 技术 使 用 了 
局 域 无 线 电 信道 ; 蜂窝 接 入 技术 使 用 了 广 域 无线 电 信道 。 我 们 将 在 第 7 章 中 详细 讨论 无 线 
电信 道 。 

5. 卫星 无 线 电信 道 

一 颗 通信 卫星 连接 地 球 上 的 两 个 或 多 个 微波 发 射 器 /接收 器 ， 它 们 被 称 为 地 面 站 。 该 卫 
星 在 一 个 频段 上 接收 传输 ， 使 用 一 个 转发 器 ( 下面 讨 论 ) 再 生 信 号 ， 并 在 另 一 个 频率 上 发 射 
信号 。 通 信 中 和 常 使 用 两 类 卫星 : 同步 卫星 (geostationary satellite) 和 近 地 轨 道 ( Low- Earth 
Orbiting, LEO) 卫星 [Wiki Satellite 2016 | 。 

同步 卫星 永久 地 停留 在 地 球 上 方 的 相同 点 上 。 这 种 静止 性 是 通过 将 卫星 置 于 地 球 表面 
上 方 36 000km 的 轨道 上 而 取得 的 。 从 地 面 站 到 卫星 再 回 到 地 面 站 的 巨大 距离 引入 了 可 观 
的 280ms 信号 传播 时 延 。 不 过 ， 能 以 数 百 Mbps 速率 运行 的 卫星 链 路 通常 用 于 那些 无 法 使 
用 DSL 或 电缆 因特网 接 和 人 的 区 域 。 

近 地 轨 道 卫 星 放 置 得 非常 靠近 地 球 ， 并 且 不 是 永久 地 停留 在 地 球 上 方 的 一 个 点 。 它 们 
围绕 地 球 旋转 ， 就 像 月 亮 围绕 地 球 旋 转 那 样 ， 并 旦 彼此 之 间 可 进行 通信 ， 也 可 以 与 地 面 站 
通信 。 为 了 提供 对 一 个 区 域 的 连续 覆盖 ， 需 要 在 轨道 上 放置 许多 卫星 。 当 前 有 许多 低 轨道 
通信 系统 在 研制 中 。LEO 卫星 技术 未 来 也 许 能 够 用 于 因特网 接 人 。 


1.3 网 络 核心 


在 考察 了 因特网 边 绿 后 ， 我 们 现在 更 深入 地 人 研究 网 络 核心 ， 即 由 互联 因特网 端 系 统 的 
分 组 交换 机 和 链 路 构成 的 网 状 网 络 。 图 1-10 用 加 粗 阴影 线 勾 画 出 网 络 核心 部 分 。 


1.3.1 分 组 交换 


在 各 种 网 络 应 用 中 ， 端 系统 彼此 交换 报 文 ( message) 。 报 文 能 够 包含 协议 设计 者 需 
要 的 任何 东西 。 报 文 可 以 执行 一 种 控制 功能 (例如 ， 图 1-2 所 示例 子 中 的 “你 好 ” 报 
X), ， 也 可 以 包含 数据 ， 例 如 电子 邮件 数据 、JPEG 图 像 或 MP3 音频 文件 。 为 了 从 源 端 
系统 加 目的 端 系统 发 送 一 个 报 文 ， 源 将 长 报 文 划分 为 较 小 的 数据 块 ， 称 之 为 分 组 
(packet) 。 在 源 和 目的 地 之 间 ， 每 个 分 组 都 通过 通信 和 链 路 和 分 组 交换 机 (packet switch) 
传送 。( 交换 机 主要 有 两 类 : 路 由 器 (router) 和 链 路 层 交 换 机 (link-layer switch ) 。) 分 组 
以 等 于 该 链 路 最 大 传输 速率 的 速度 传输 通过 通信 和 链 路 。 因 此 ， 如 果 某 源 端 系统 或 分 组 交换 
机 经 过 一 条 链 路 发 送 一 个 上 比特 的 分 组 ， 链 路 的 传输 速率 为 R 比特 / 秒 ， 则 传输 该 分 组 的 
WHEA L/R 秒 。 

1. 存储 转发 传输 


多 数 分 组 交换 机 在 链 路 的 输入 端 使 用 存储 转发 传输 ( store- and- forward transmission ) 
机 制 。 存 储 转发 传输 是 指 在 交换 机 能 够 开始 向 输出 链 路 传输 该 分 组 的 第 一 个 比特 之 前 ， 必 
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图 1-10 网 络 核心 
须 接 收 到 整个 分 组 。 为 了 更 为 详细 地 探讨 存储 转发 传输 ， 考 虑 由 两 个 端 系统 经 一 台 路 由 天 


连接 构成 的 简单 网 络 ， 如 图 1- 11 所 示 。 
一 人 台 路 由 器 通常 有 多 条 繁忙 的 链 路 ， 因 
为 它 的 任务 就 是 把 一 个 人 分 组 交换 到 一 






条 出 链 路 。 在 这 个 简单 例子 中 , 该 路 由 。 O° eB te 目的 地 
器 的 任务 相当 简单 : 将 分 组 从 一 条 ( 输 人 

A) 链 路 转移 到 另 一 条 唯一 的 连接 链 路 。 = en 

在 图 1-11 所 示 的 特定 时 刻 ， 源 已 经 传输 图 1-11 存储 转发 分 组 交换 


了 分 组 1 的 一 部 分 ， 分 组 1 的 前 沿 已 经 到 达 了 路 由 器 。 因 为 该 路 由 融 应 用 了 存储 转发 机 
制 ， 所 以 此 时 它 还 不 能 传输 已 经 接收 的 比特 ， 而 是 必须 先 缓存 〈 即 “人 存储” ) 该 分 组 的 比 
特 。 仅 当 路 由 需 已 经 接收 完了 该 分 组 的 所 有 比特 后 ， 它 才能 开始 回 出 链 路 传输 〈 即 “ 转 
Be”) 该 分 组 。 为 了 深刻 领悟 存储 转发 传输 ， 我 们 现在 计算 一 下 从 源 开始 发 送 分 组 到 目的 
地 收 到 整个 分 组 所 经 过 的 时 间 。( 这 里 我 们 将 忽略 传播 时 延 一 一 指 这 些 比 特 以 接近 光速 的 
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速度 跨越 线路 所 需要 的 时 间 ， 这 将 在 1. 4 AE) 源 在 时 刻 0 开始 传输 ， 在 时 刻 L/R E, 
因为 该 路 由 句 刚 好 接收 到 整个 分 组 ， 所 以 它 能 够 朝 着 目的 地 向 出 链 路 开始 传输 分 组 ;在 时 
刻 2LAR， 路 由 带 已 经 传输 了 整个 分 组 ， 并且 整个 分 组 已 经 被 目的 地 接收 。 所 以 ， 总 时 延 
是 2LAR。 如 果 交 换 机 一 旦 比特 到 达 就 转发 比特 (不必 首先 收 到 整个 分 组 )， 则 因为 比特 没 
有 在 路 由 器 保存 ， 总 时 延 将 是 LAR。 但 是 如 我 们 将 在 1.4 PPRA, h ATETA 
前 需要 接收 、 存 储 和 处 理 整个 分 组 。 

现在 我 们 来 计算 从 源 开 始 发 送 第 一 个 分 组 到 目的 地 接收 到 所 有 三 个 分 组 所 需 的 时 间 。 
与 前 面 一 样 ， 在 时 刻 LAR， 路 由 器 开始 转发 第 一 个 分 组 。 而 在 时 刻 L/R 源 也 开始 发 送 第 二 
个 分 组 ， 因 为 它 已 经 完成 了 第 一 个 分 组 的 完整 发 送 。 因 此 ， 在 时 刻 2LAR， 目 的 地 已 经 收 
到 第 一 个 分 组 并 且 路 由 器 已 经 收 到 第 二 个 分 组 。 类 伏地 ， 在 时 刻 3ZR， 目 的 地 已 经 收 到 
前 两 个 分 组 并 且 路 由 融 已 经 收 到 第 三 个 分 组 。 最 后 ， 在 时 刻 4LAR， 目 的 地 已 经 收 到 所 有 3 
个 分 组 ! 

我 们 现在 来 考虑 下 列 一 般 情况 : 通过 由 N 条 速率 均 为 R 的 链 路 组 成 的 路 径 (所 以 ， 
在 源 和 目的 地 之 间 有 NN -1 台 路 由 器 ) ， 从 源 到 目的 地 发 送 一 个 分 组 。 应 用 如 上 相同 的 逻 
辑 ， 我 们 看 到 端 到 端 时 延 是 : 

dysa = n= (1-1) 
你 也 许 现 在 要 试 着 确定 P 个 分 组 经 过 NN 条 链 路 序列 的 时 延 有 多 大 。 
2. 排队 时 延 和 分 组 丢失 


每 台 分 组 交换 机 有 多 条 链 路 与 之 相连 。 对 于 每 条 相连 的 链 路 ， 该 分 组 交换 机 具有 一 个 
输出 缓存 (output buffer， 也 称 为 输出 队列 (output queue) ) ， 它 用 于 存储 路 由 器 准备 发 往 
那 条 链 路 的 分 组 。 该 输出 缓存 在 分 组 交换 中 起 着 重要 的 作用 。 如 果 到 达 的 分 组 需要 传输 到 
某 条 链 路 ， 但 发 现 该 链 路 正 忙 于 传输 其 他 分 组 ， 该 到 达 分 组 必须 在 输出 缓存 中 等 待 。 因 
-此 ， 除 了 存储 转发 时 延 以 外 ， 分 组 还 要 承受 输出 缓存 的 排队 时 延 (queuing delay ) 。 这 些 时 
延 是 变化 的 ， 变 化 的 程度 取决 于 网 络 的 拥塞 程度 。 因 为 缓存 空间 的 大 小 是 有 限 的 ， 一 个 到 
达 的 分 组 可 能 发 现 该 缓存 已 被 其 他 等 待 传输 的 分 组 完全 充满 了 。 在 此 情况 下 ， 将 出 现 分 组 
丢失 (EE) (packet loss), ， 到 达 的 分 组 或 已 经 排队 的 分 组 之 一 将 被 丢弃 。 

图 1-12 显示 了 一 个 简单 的 分 组 交换 网 络 。 如 在 图 1-11 中 ,分 组 被 表示 为 三 维 厚 片 。 
厚 片 的 宽度 表示 了 该 分 组 中 比特 的 数量 。 在 这 张 图 中 ， 所 有 分 组 具有 相同 的 宽度 ， 因 此 有 
相同 的 长 度 。 假 定 主 机 AM B 向 主机 发送 分 组 。 主 机 A 和 B 先 通过 100Mbps 的 以 太 网 
链 路 向 第 一 个 路 由 器 发 送 分 组 。 该 路 由 器 则 将 这 些 分 组 导向 到 一 条 15Mbps 的 链 路 。 在 某 
个 短 时 间 间 隔 内 ， 如 果 分 组 到 达 路 由 器 的 到 达 率 〈 转 换 为 每 秒 比特 ) 超过 了 15Mbps， 这 
些 分 组 在 通过 链 路 传输 之 前 ， 将 在 链 路 输出 缓存 中 排队 ， 在 该 路 由 器 中 将 出 现 拥 塞 。 例 
如 ， 如 果 主 机 A 和 主机 B 每 个 都 同时 发 送 了 5 个 紧 接着 的 分 组 突 发 块 ， 则 这 些 分 组 中 的 大 
多 数 将 在 队列 中 等 待 一 些 时 间 。 事 实 上 ， 这 完全 类 似 于 每 天 都 在 经 历 的 一 些 情况 ， 例 如 当 
我 们 在 银行 柜台 前 排队 等 待 或 在 过 路 收费 站 前 等 待 时。 我 们 将 在 1.4 节 中 更 为 详细 地 研究 
这 种 排队 时 延 。 

3. 转发 表 和 路 由 选择 协议 

前 面 我 们 说 过 ， 路 由 器 从 与 它 相 连 的 一 条 通信 和 链 路 得 到 分 组 ， 然 后 向 与 它 相 连 的 为 一 
条 通信 链 路 转发 该 分 组 。 但 是 路 由 器 怎样 决定 它 应 当 向 哪 条 链 路 进行 转发 呢 ? 不 同 的 计算 


机 网 络 实际 上 是 以 不 同 的 方式 完成 分 组 转发 的 。 这 里 ， 我 们 简要 介绍 在 因特网 中 所 采用 的 
方法 。 


等 待 输 出 链 路 
的 分 组 队列 
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图 1-12 分 组 交换 


在 因特网 中 ， 每 个 端 系 统 具 有 一 个 称 为 IP 地 址 的 地 址 。 当 源 主机 要 疝 目的 端 系 统 发 
送 一 个 分 组 时 ， 源 在 该 分 组 的 首部 包含 了 目的 地 的 IP 地 址 。 如 同 邮 政 地 址 那样 ， 该 地 址 
具有 一 种 等 级 结构 。 当 一 个 分 组 到 达 网 络 中 的 路 由 器 时 ， 路 由 天 检查 该 分 组 的 目的 地 址 的 
一 部 分 ， 并 向 一 台 相 邻 路 由 器 转发 该 分 组 。 更 特别 的 是 ， 每 台 路 由 器 具有 一 个 转发 表 
(forwarding table) ， 用 于 将 目的 地 址 (或 目的 地 址 的 一 部 分 ) 映射 成 为 输出 链 路 。 当 某 分 
组 到 达 一 人 台 路 由 器 时 ， 路 由 器 检查 该 地 址 ， 并 用 这 个 目的 地 址 搜索 其 转发 表 ， 以 发 现 适 当 
的 出 链 路 。 路 由 需 则 将 分 组 导 回 该 出 链 路 。 

痊 到 端 选 路 过 程 可 以 用 一 个 不 使 用 地 图 而 喜欢 问 路 的 汽车 驾驶 员 来 类 比 。 例 如 ， 假 是 
Joe 驾车 从 费城 到 佛罗里达 州 奥 兰 多 市 的 Lakeside Drive 街 156 7, Joe 先 节 车 到 附近 的 加 
油 站 ， 询 问 怎样 才能 到 达 佛 罗 里 达州 奥兰多 市 的 Lakeside Drive 街 156 号 。 加 油 站 的 服务 
员 从 该 地 址 中 抽取 了 佛罗里达 州 部 分 ， 告 诉 Joe 他 需要 上 1-95 南 州 际 公 路 ， 该 公路 恰 有 一 
个 邻近 该 加 油 站 的 人 口 。 他 又 告诉 Joe, 一 旦 到 了 佛罗里达 后 应 当 再 问 当 地 人 。 于 是 ，Joe 
ET 1-95 南 州 际 公路 ， 一 直到 达 佛 罗 里 达 的 Jacksonville， 在 那里 他 向 另 一 个 加 油 站 服务 员 
问 路 。 该 服务 员 从 地 址 中 抽取 了 奥兰多 市 部 分 ， 告 诉 Joe 他 应 当 继 续 沿 1-95 公路 到 Dayto- 
na 海滩， 然后 青 问 其 他 人 。 在 Daytona 海滩 ， 另 一 个 加 油 站 服务 员 也 抽取 该 地 址 的 奥兰多 
部 分 ， 告诉 Joe MHE 1-4 公路 直接 前 往 奥兰多 。jJoe €T 1-4 公路 ， 并 从 奥兰多 出 口 下 来 。 
Joe 又 回 另 一 个 加 油 站 的 服务 员 询 问 ， 这 时 该 服务 员 抽 取 了 该 地 址 的 Lakeside Drive 部 分 ， 
告诉 了 Joe 到 Lakeside Drive 必须 要 走 的 路 。 一 旦 Joe 到 达 了 Lakeside Drive， 他 加 一 个 骑 目 
行车 的 小 孩 询 问 了 到 达 目 的 地 的 方法 。 这 个 孩子 抽取 了 该 地 址 的 156 号 部 分 ， 并 指示 了 房 
屋 的 方向 。Joe 最 后 到 达 了 最 终 目 的 地 。 在 上 述 类 比 中 ， 那 些 加 油 站 服务 员 和 骑 车 的 孩子 
可 类 比 为 路 由 器 。 

我 们 刚刚 学 习 了 路 由 顺 使 用 分 组 的 目的 地 址 来 索引 转发 表 并 决定 适当 的 出 链 路 。 但 是 
这 个 叙述 还 要 求 回答 另 一 个 问题 : 转发 表 是 如 何 进行 设置 的 ?是 通过 人 工 对 每 台 路 由 器 逐 
台 进 行 配置 ， 还 是 因特网 使 用 更 为 自动 的 过 程 进 行 配置 呢 ? 第 5 章 将 深入 探讨 这 个 问题 。 
但 在 这 里 为 了 激发 你 的 求知 欲 ， 我 们 现在 将 告诉 你 因特网 具有 一 些 特殊 的 路 由 选择 协议 
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(routing protocol) ， 用 于 目 动 地 设置 这 些 转发 表 。 例 如 ， 一 个 路 由 选择 协议 可 以 决定 从 每 
台 路 由 器 到 每 个 目的 地 的 最 短路 径 ， 并 使 用 这 些 最 短路 径 结 果 来 配置 路 由 需 中 的 转发 表 。 

怎样 才能 实际 看 到 分 组 在 因特网 中 所 走 的 端 到 端 路 由 呢 ? 我 们 现在 请 你 亲手 用 一 下 
Traceroute 程序 。 直 接 访问 站 点 www. traceroute. org， 在 一 个 特定 的 国家 中 选择 一 个 源 ， 跟 
踪 从 该 源 到 你 的 计算 机 的 路 由 。( 参 见 1.4 节 有 关 Traceroute 的 讨论 。) 


1.3.2 电路 交换 


通过 网 络 链 路 和 交换 机 移动 数据 有 两 种 基本 方法 : 电路 交换 (circuit switching) 和 分 
组 交换 (packet switching)。 上 一 小 节 已 经 讨论 过 分 组 交换 网 络 ， 现 在 我 们 将 注意 力 转 问 电 
路 交换 网 络 。 

在 电路 交换 网 络 中 ， 在 端 系 统 间 通信 会 话 期 间 ， 预 留 了 端 系统 间 沿 路 径 通 信和 所 需要 的 
资源 (缓存 ， 链 路 传输 速率 ) 。 在 分 组 交换 网 络 中 ， 这 些 资 源 则 不 是 预 留 的 ; 会 话 的 报 文 
按 需 使 用 这 些 资源 ， 其 后 果 可 能 是 不 得 不 等 待 ( 即 排队 ) 接 人 通信 线路 。 一 个 简单 的 类 比 
是 ， 考 虑 两 家 餐馆， 一 家 需要 顾客 预订 ， 而 男 一 家 不 需要 预订 ， 但 不 保证 能 安排 顾客 。 对 
于 需要 预订 的 那 家 餐馆 ， 我 们 在 离开 家 之 前 必须 承受 先 打 电话 预订 的 麻烦 ， 但 当 我 们 到 达 
该 餐馆 时 ， 原 则 上 我 们 能 够 立即 入 座 并 点 菜 。 对 于 不 需要 预订 的 那 家 餐馆 ， 我 们 不 必 麻 烦 
地 预订 餐桌 ,但 当 我 们 到 达 该 餐馆 时 ， 也 许 不 得 不 先 等 待 一 张 餐桌 空闲 后 才能 入座 。 

传统 的 电话 网 络 是 电路 交换 网 络 的 例子 。 考 虑 当 一 个 人 通过 电话 网 向 另 一 个 人 发 送信 
息 (语音 或 传真 ) 时 所 发 生 的 情况 。 在 发 送 方 能 够 发 送信 息 之 前 ， 该 网 络 必 须 在 发 送 方 和 
接收 方 之 间 建 立 一 条 连接 。 这 是 一 个 名 副 其 实 的 连接 ， 因 为 此 时 沿 着 发 送 方 和 接收 方 之 间 
路 径 上 的 交换 机 都 将 为 该 连接 维护 连接 状态 。 用 电话 的 术语 来 说 ， 该 连接 被 称 为 一 条 电路 
(circuit) 。 当 网 络 创建 这 种 电路 时 ， 它 也 在 连接 期 间 在 该 网 络 链 路 上 预 留 了 恒定 的 传输 速 
K (表示 为 每 条 链 路 传输 容量 的 一 部 分 ) 。 既 然 已 经 为 该 发 送 方 -接收 方 连接 预 留 了 带宽 ， 
则 发 送 方 能 够 以 确保 的 恒定 速率 向 接收 方 传送 数据 。 

图 1-13 显示 了 一 个 电路 交换 网 络 。 在 这 个 网 络 中 ,用 4 条 链 路 互联 了 4 台电 路 交换 机 。 
这 些 链 路 中 的 每 条 都 有 4 条 电路 ， 因 此 每 条 链 路 能 够 支持 4 条 并 行 的 连接 。 每 台 主 机 (例如 
PC 和 工作 站 ) 都 与 一 台 交 换 机 直接 相连 。 
当 两 台 主 机 要 通信 时 ， 该 网 络 在 两 台 主 机 之 A 
间 创 建 一 条 专用 的 端 到 端 连接 (end-to-end 
connection ) 。 因 此 ， 主 机 A 为 了 回 主 机 了 发 
送 报 文 ， 网 络 必须 在 两 条 链 路 的 每 条 上 先 预 
留 一 条 电路 。 在 这 个 例子 中 ， 这 条 专用 的 端 
到 端 连 接 使 用 第 一 条 链 路 中 的 第 二 条 电路 和 
第 二 条 链 路 中 的 第 四 条 电路 。 因 为 每 条 链 
路 具有 4 条 电路 ， 对 于 由 端 到 端 连接 所 使 
用 的 每 条 链 路 而 言 ， 该 连接 在 连接 期 间 获 
得 链 路 总 传输 容量 的 1/4。 例 如 ， 如 果 两 台 图 1-13 由 4 台 交 换 机 和 4 条 链 路 组 成 的 
邻近 交换 机 之 间 每 条 链 路 具有 1Mbps 传输 一 个 简单 电路 交换 网 络 
速率 ， 则 每 个 端 到 端 电路 交换 连接 获得 25Okbps 专用 的 传输 速率 。 

与 此 相反 ， 考 虑 一 台 主 机 要 经 过 分 组 交换 网 络 (如 因特网 ) 向 另 一 台 主 机 发 送 分 组 所 
发 生 的 情况 。 与 使 用 电路 交换 相同 ， 该 分 组 经 过 一 系列 通信 链 路 传输 。 但 与 电路 交换 不 同 
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的 是 ， 该 分 组 被 发 送 进 网 络 ， 而 不 预 留任 何 链 路 资源 之 类 的 东西 。 如 果 因 为 此 时 其 他 分 组 
也 需要 经 该 链 路 进行 传输 而 使 链 路 之 一 出 现 拥 塞 ， 则 该 分 组 将 不 得 不 在 传输 链 路 发 送 侧 的 
缓存 中 等 待 而 产生 时 延 。 因 特 网 尽 最 大 努力 以 实时 方式 交付 分 组 ， 但 它 不 做 任何 保证 。 

1. 电路 交换 网 络 中 的 复 用 

链 路 中 的 电路 是 通过 频 分 复 用 (Frequency- Division Multiplexing, FDM) 或 时 分 复 用 
( Time- Division Multiplexing, TDM) 来 实现 的 。 对 于 FDM， 链 路 的 频谱 由 跨越 链 路 创建 的 
所 有 连接 共享 。 特 别 是， 在 连接 期 间 链 路 为 每 条 连接 专用 一 个 频段 。 在 电话 网 络 中 ， 这 个 
频段 的 宽度 通常 为 4kHz ( 即 每 秒 4000 周期 ) 。 训 无 疑问 ， 该 频段 的 宽度 称 为 带宽 ( band- 
width) 。 调 频 无 线 电 台 也 使 用 FDM 来 共享 88MHz ~ 108MHz 的 频谱 ， 其 中 每 个 电台 被 分 配 
一 个 特定 的 频段 。 

对 于 一 条 TDM 链 路 ， 时 间 被 划分 为 固定 期 间 的 帧 ， 并 且 每 个 帧 又 被 划分 为 固定 数量 
的 时 阶 。 当 网 络 跨越 一 条 链 路 创建 一 条 连接 时 ， 网 络 在 每 个 帧 中 为 该 连接 指定 一 个 时 陀 。 
这 些 时 隙 专门 由 该 连接 单独 使 用 ， 一 个 时 际 (在 每 个 帧 内 ) 可 用 于 传输 该 连接 的 数据 。 

图 1-14 显示 了 一 个 支持 多 达 4 条 电路 的 特定 网 络 链 路 的 FDM 和 TDM。 对 于 FDM, 其 
频率 域 被 分 割 为 4 个 频段 ， 每 个 频段 的 带宽 是 4kHz。 对 于 TDM， 其 时 域 被 分 割 为 帧 ， 在 
每 个 帧 中 具有 4 个 时 除 ， 在 循环 的 TDM 帧 中 每 条 电路 被 分 配 相 同 的 专用 时 际 。 对 于 TDM, 
一 条 电路 的 传输 速率 等 于 帧 速率 乘 以 一 个 时 际 中 的 比特 数量 。 例 如 ， 如 果 链 路 每 秒 传输 
8000 个 帧 ， 每 个 时 隙 由 8 个 比特 组 成 ， 则 每 条 电路 的 传输 速率 是 64kbps, 
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图 1-14 对 于 FDM， 每 条 电路 连续 地 得 到 部 分 带宽 。 对 于 TDM， 每 条 电路 在 
短 时 间 间 隔 ( 即时 际 ) 中 周期 性 地 得 到 所 有 带宽 


分 组 交换 的 支持 者 总 是 争辩 说 ， 电 路 交换 因为 在 静默 期 (silent period) 专用 电路 空闲 
而 不 够 经 济 。 例 如 ， 打 电话 的 一 个 人 停止 讲话 ， 空 闲 的 网 络 资源 〈 在 沿 该 连接 路 由 的 链 路 
中 的 频段 或 时 隙 ) 不 能 被 其 他 进行 中 的 连接 所 使 用 。 作 为 这 些 资 源 不 能 有 效 利用 的 为 一 个 
例子 ， 考 虑 一 名 放射 科 医师 使 用 电路 交换 网 络 远程 存 取 一 系列 X 射线 图 像 。 该 放射 科 医 师 
建立 一 条 连接 ， 请 求 一 幅 图 像 ， 然 后 判读 该 图 像 ， 然 后 再 请 求 一 幅 新 图 像 。 在 放射 科 医 师 
判读 图 像 期 间 ， 网 络 资源 分 配给 了 该 连接 但 没有 使 用 ( 即 被 浪费 了 )。 分 组 交换 的 支持 者 
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还 津津 乐 道 地 指出 ， 创 建 端 到 端 电 路 和 预 留 端 到 端 带宽 是 复杂 的 ， 需 要 复杂 的 信 令 软件 以 
协调 沿 端 到 端 路 径 的 交换 机 的 操作 。 

在 结束 讨论 电路 交换 之 前 ， 我 们 讨论 一 个 用 数字 表示 的 例子 ， 它 更 能 说 明 问题 的 实 
质 。 考 虑 从 主机 A 到 主机 B 经 一 个 电路 交换 网 络 发 送 一 个 640 000 比特 的 文件 需要 多 长 
时 间 。 假 如 在 该 网 络 中 所 有 链 路 使 用 具有 24 时 际 的 TDM， 比 特 速率 为 1. 536Mbps。 同 
时 假定 在 主机 A 能 够 开始 传输 该 文件 之 前 ， 需 要 500ms 创建 一 条 端 到 端 电路 。 它 需要 多 
长 时 间 才 能 发 送 该 文件 ”每 条 链 路 具有 的 传输 速率 是 1. 536Mbps/24 =64kbps， 因 此 传 
输 该 文件 需要 (640kb)/(64kbps) =10s。 这 个 10s， 再 加 上 电路 创建 时 间 ， 这 样 就 需要 
10. 5s 发 送 该 文件 。 值 得 注意 的 是 ， 该 传输 时 间 与 链 路 数量 无 关 : 端 到 端 电 路 不 管 是 通 
过 一 条 链 路 还 是 100 条 链 路 ， 传 输 时 间 都 将 是 10s。( 实际 的 端 到 端 时 延 还 包括 传播 时 
延 ， 参 见 1.4 节 。) 

2. 分 组 交换 与 电路 交换 的 对 比 

在 描述 了 电路 交换 和 分 组 交换 之 后 ， 我 们 来 对 比 一 下 这 两 者 。 分 组 交换 的 批评 者 经 党 
争辩 说 ， 分 组 交换 不 适合 实时 服务 (例如 ， 电 话 和 视频 会 议 ) ， 因 为 它 的 端 到 端 时 延 是 可 
变 的 和 不 可 预测 的 (主要 是 因为 排队 时 延 的 变动 和 不 可 预测 所 致 )。 分 组 交换 的 支持 者 却 
争辩 道 : QD 它 提 供 了 比 电路 交换 更 好 的 带宽 共享 ; @ 它 比 电路 交换 更 简单 、 更 有 效 ， 实 现 
成 本 更 低 。 分 组 交换 与 电路 交换 之 争 的 有 趣 讨论 参见 [Molinero- Fernandez 2002 ] 。 概 括 而 
言 ， 嫌 餐馆 预订 麻烦 的 人 宁可 要 分 组 交换 而 不 愿意 要 电路 交换 。 

分 组 交换 为 什么 更 有 效 呢 ? 我 们 看 一 个 简单 的 例子 。 假 定 多 个 用 户 共 享 一 条 1Mbps 链 
路 ， 再 假定 每 个 用 户 活跃 周期 是 变化 的 ， 某 用 户 时 而 以 100kbps 恒定 速率 产生 数据 ， 时 而 
静止 一 一 这 时 用 户 不 产生 数据 。 进 一 步 假定 该 用 户 仅 有 10% 的 时 间 活 路 (余下 的 90% 的 
时 间 空 闲 下 来 喝 咖 啡 ) 。 对 于 电路 交换 ， 在 所 有 的 时 间 内 必须 为 每 个 用 户 预 留 100kbps。 例 
如 ， 对 于 电路 交换 的 TDM， 如 果 一 个 1s 的 帧 被 划分 为 10 个 时 际 ， 每 个 时 际 为 00ms， 则 
每 帧 将 为 每 个 用 户 分 配 一 个 时 隙 。 

因此 ， 该 电路 交换 链 路 仅 能 支持 10 ( =1Mbps/100kbps) 个 并 发 的 用 户 。 对 于 分 组 交 
H, 一 个 特定 用 户 活跃 的 概率 是 0.1 ( 即 10% ) 。 如 果 有 35 个 用 户 ， 有 11 或 更 多 个 并 发 
活跃 用户 的 概率 大 约 是 0. 0004。( 课 后 习题 PS 概述 如 何 得 到 这 个 概率 值 。) 当 有 10 个 或 
更 少 并 发 用 户 (以 概率 0.9996 RÆ) 时 ， 到 达 的 聚合 数据 速率 小 于 或 等 于 该 链 路 的 输出 
速率 1Mbps。 因 此 ， 当 有 10 个 或 更 少 的 活跃 用 户 时 ,通过 该 链 路 的 分 组 流 基本 上 没有 时 
延 ， 这 与 电路 交换 的 情况 一 样 。 当 同时 活跃 用 户 超过 10 个 时 ， 分 组 的 聚合 到 达 速 率 超过 
该 链 路 的 输出 容量 ， 则 输出 队列 将 开始 变 长 。( 一 直 增 长 到 聚合 输入 速率 重新 低 于 1Mbps, 
此 后 该 队列 长 度 才 会 减少 。) 因为 在 本 例子 中 同时 活跃 用 户 超过 10 个 的 概率 极 小 ， 分 组 交 
换 差不多 总 是 提供 了 与 电路 交换 相同 的 性 能 ， 并 且 允 许 在 用 户 数 量 是 其 3 倍 时 情况 也 是 
如 此 。 

我 们 现在 考虑 第 二 个 简单 的 例子 。 假 定 有 10 个 用 户 ， 某 个 用 户 突 然 产生 1000 个 1000 
比特 的 分 组 ， 而 其 他 用 户 则 保持 静默 ， 不 产生 分 组 。 在 每 帧 具有 10 个 时 隙 并 且 每 个 时 隙 
包含 1000 比特 的 TDM 电路 交换 情况 下 ， 活 跃 用 户 仅 能 使 用 每 帧 中 的 一 个 时 隙 来 传输 数 
据 ， 而 每 个 帧 中 剩余 的 9 个 时 隙 保持 空闲 。 该 活 牙 用 户 传输 完 所 有 10° 比特 数据 需要 10s 
的 时 间 。 在 分 组 交换 情况 下 ， 活 跃 用 户 能 够 连续 地 以 1Mbps 的 全 部 链 路 速率 发 送 其 分 组 ， 
因为 没有 其 他 用 户 产生 分 组 与 该 活路 用户 的 分 组 进行 复 用 。 在 此 情况 下 ， 该 活跃 用 户 的 所 


有 数据 将 在 1s 内 发 送 完毕 。 

上 面 的 例子 从 两 个 方面 表明 了 分 组 交换 的 性 能 能 够 优 于 电路 交换 的 性 能 。 这 些 例子 也 
强调 了 在 多 个 数据 流 之 间 共 享 链 路 传输 速率 的 两 种 形式 的 关键 差异 。 电 路 交换 不 考虑 需 
求 ， 而 预先 分 配 了 传输 链 路 的 使 用 ， 这 使 得 已 分 配 而 并 不 需要 的 链 路 时 间 未 被 利用 。 男 一 
方面 ， 分 组 交换 按 需 分 配 链 路 使 用 。 链 路 传输 能 力 将 在 所 有 需要 在 链 路 上 传输 分 组 的 用 户 
之 间 逐 分 组 地 被 共享 。 

虽然 分 组 交换 和 电路 交换 在 今天 的 电信 网 络 中 都 是 普遍 采用 的 方式 ,但 趋势 无 疑 是 朝 
着 分 组 交换 方向 发 展 。 甚 至 许多 今天 的 电路 交换 电话 网 正在 缓慢 地 向 分 组 交换 迁移 。 特 别 
是 ， 电 话 网 经 党 在 昂贵 的 海外 电话 部 分 使 用 分 组 交换 。 


1.3.3 网 络 的 网 络 


我 们 在 前 面 看 到 ， 端 系统 (PC、 智 能 手机 、Web 服务 器 、 电 子 邮 件 服务 器 等 ) AE 
一 个 接 入 ISP 与 因特网 相连 。 该 接 入 ISP 能 够 提供 有 线 或 无 线 连接 ， 使 用 了 包括 DSL、 电 
Ai. FITH, WiFi 和 蜂窝 等 多 种 接 入 技术 。 值 得 注意 的 是 ， 接 入 ISP 不 必 是 电信 局 或 电线 
公司 ， 相 反 ， 它 能 够 是 如 大 学 (为 学 生 、 教 职员 工 和 从 业 人 员 提 供 因 特 网 接 人 ) 或 公司 
(为 其 雇员 提供 接 人 ) 这 样 的 单位 。 但 让 端 用 户 和 内 容 提 供 商 连接 到 接 入 ISP 仅 解决 了 连 
接 难 题 中 的 很 小 一 部 分 ， 因 为 因特网 是 由 数 以 亿 计 的 用 户 构 成 的 。 要 解决 这 个 难题 ， 接 入 
ISP 自身 必须 互联 。 通 过 创建 网 络 的 网 络 可 以 做 到 这 一 点 ， 理 解 这 个 短语 是 理解 因特网 的 
关键 。 

年 复 一 年 ， 构 成 因特网 的 “网 络 的 网 络 ” 已 经 演化 成 为 一 个 非常 复杂 的 结构 。 这 种 演 
化 很 大 部 分 是 由 经 济 和 国家 策略 驱动 的 ， 而 不 是 由 性 能 考虑 驱动 的 。 为 了 理解 今天 的 因 特 
网 的 网 络 结构 ， 我 们 以 逐步 递 进 方式 建造 一 系列 网 络 结 构 ， 其 中 的 每 个 新 结构 都 更 好 地 接 
近 现在 的 复杂 因特网 。 回 顾 前 面 互 联接 人 ISP 的 中 心目 标 ， 是 使 所 有 端 系统 能 够 彼此 发 送 
分 组 。 一 种 幼稚 的 方法 是 使 每 个 接 入 ISP 直接 与 每 个 其 他 接 人 ISP 连接 。 当 然 ， 这 样 的 网 
状 设计 对 于 接 入 ISP 费用 太 高 ， 因 为 这 将 要 求 每 个 接 人 ISP 要 与 世界 上 数 十 万 个 其 他 接 人 
ISP 有 一 条 单独 的 通信 链 路 。 

我 们 的 第 一 个 网 络 结构 即 网 络 结构 1， 用 单一 的 全 球 传 输 ISP 互联 所 有 接 入 ISP。 我 们 
假想 的 全 球 传输 ISP 是 一 个 由 路 由 器 和 通信 和 链 路 构成 的 网 络 ， 该 网 络 不 仅 跨 越 全 球 ， 而 且 
至 少 具 有 一 台 路 由 器 靠近 数 十 万 接 人 ISP 中 的 每 一 个 。 当 然 ， 对 于 全 球 传输 ISP， 建 造 这 
样 一 个 大 规模 的 网 络 将 耗资 巨大 。 为 了 有 利 可 图 ， 自 然 要 向 每 个 连接 的 接 入 ISP 收费 ， 其 
价格 反映 (并 不 一 定 正比 于 ) 一 个 接 入 ISP 经 过 全 球 ISP 交换 的 流量 大 小 。 因 为 接 入 ISP 
向 全 球 传输 ISP 付费 ， 故 接 入 ISP 被 认为 是 客户 (customer), ， 而 全 球 传输 ISP 被 认为 是 提 
供 商 (provider), 

如 果 某 个 公司 建立 并 运营 一 个 可 赢利 的 全 球 传输 ISP， 其 他 公司 建立 自己 的 全 球 传输 
ISP 并 与 最 初 的 全 球 传输 ISP 竞争 则 是 一 件 自然 的 事 。 这 导致 了 网 络 结构 2， 它 由 数 十 万 接 
A ISP 和 多 个 全 球 传输 ISP 组 成 。 接 人 ISP 无 疑 喜欢 网 络 结构 2 胜 过 襄 欢 网 络 结构 1， 因为 
它们 现在 能 够 根据 价格 和 服务 因素 在 多 个 竞争 的 全 球 传输 提供 商 之 间 进 行 选择 。 然 而 ， 值 
得 注意 的 是 ， 这 些 全 球 传输 ISP 之 间 必 须 是 互联 的 ; 不 然 的 话 ， 与 某 个 全 球 传输 ISP 连接 
Ae A. ISP 将 不 能 与 连接 到 其 他 全 球 传输 ISP 的 接 入 ISP 进行 通信 。 

刚才 描述 的 网 络 结构 2 是 一 种 两 层 的 等 级 结构 ， 其 中 全 球 传输 提供 商 位 于 顶层 ， 而 接 
入 ISP 位 于 底层 。 这 假设 了 全 球 传输 ISP 不 仅 能 够 接近 每 个 接 入 ISP， 而 且 发 现 经 济 上 也 
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希望 这 样 做 。 现 实 中 ， 尽 管 某 些 SP 确实 具有 令 人 印象 深刻 的 全 球 覆 盖 ， 并 且 确 实 直接 与 
许多 接 入 ISP 连接 ， 但 世界 上 没有 哪个 ISP 是 无 处 不 在 的 。 相 反 ， 在 任何 给 定 的 区 域 ， 可 
能 有 一 个 区 域 ISP (regional ISP) ， 区 域 中 的 接 人 ISP 与 之 连接 。 每 个 区 域 ISP 则 与 第 一 层 
ISP (tier-1 ISP) 连接 。 第 一 层 ISP 类 似 于 我 们 假想 的 全 球 传 输 I SP， 尽管 它 不 是 在 世界 上 
每 个 城市 中 都 存在 ， 但 它 确 实 存在 。 有 大 约 十 几 个 第 一 层 ISP， 包 括 Level 3 Communica- 
tions, AT&T, Sprint 和 NTT。 有 趣 的 是 ， 没 有 组 织 正式 认可 第 一 层 状态 。 俗 话说 : 如 果 必 
须 问 你 是 否 是 一 个 组 织 的 成 员 ， 你 可 能 不 是 。 

再 来 讨论 这 个 网 络 的 网 络 ， 不 仅 有 多 个 竞争 的 第 一 层 ISP， 而 且 在 一 个 区 域 可 能 有 多 
个 竞争 的 区 域 ISP。 在 这 样 的 等 级 结构 中 ， 每 个 接 入 ISP 向 其 连接 的 区 域 ISP 支付 费用 ， 
并 且 每 个 区 域 ISP 向 它 连接 的 第 一 层 ISP 支付 费用 。( 一 个 接 入 ISP 也 能 直接 与 第 一 层 ISP 
连接 ， 这样 它 就 向 第 一 层 ISP 付费 .) 因此 ， 在 这 个 等 级 结构 的 每 一 层 ， 都 有 客户 - 提供 
商 关 系 。 值 得 注意 的 是 ， 第 一 层 ISP 不 向 任何 人 付费 ， 因 为 它们 位 于 该 等 级 结构 的 顶部 。 
更 为 复杂 的 情况 是 ， 在 某 些 区 域 ， 可 能 有 较 大 的 区 域 ISP (可 能 跨越 整个 国家 ) ， 该 区 域 
中 较 小 的 区 域 ISP 与 之 相连 ， 较 大 的 区 域 ISP 则 与 第 一 层 ISP 连接 。 例 如 ， 在 中 国 ， 每 个 
城市 有 接 入 ISP， 它 们 与 省 级 IS 连接 ， 省 级 ISP 又 与 国家 级 ISP 连接 ， 国 家 级 IS RAS 
第 一 层 ISP 连接 [Tian 2012 ] 。 这 个 多 层 等 级 结构 仍然 仅仅 是 今天 因特网 的 粗略 近似 ， 我 
们 称 它 为 网 络 结构 3。 

为 了 建造 一 个 与 今天 的 因特网 更 为 相似 的 网 络 ， 我 们 必须 在 等 级 化 网 络 结构 3 上 增加 
存在 点 (Point of Presence，PoP) 、 多 宿 、 对 等 和 因特网 交换 点 。PoP 存在 于 等 级 结构 的 所 
有 层次 ,但 底层 ( 接 入 IS) 等 级 除外 。 一 个 PoP 只 是 提供 商 网 络 中 的 一 台 或 多 人 台 路 由 顺 
(在 相同 位 置 ) 群 组 ， 其 中 客户 ISP 能 够 与 提供 商 ISP 连接 。 对 于 要 与 提供 商 PoP 连接 的 
客户 网 络 ， 它 能 从 第 三 方 电 信 提 供 商 租用 高 速 链 路 将 它 的 路 由 天 之 一 直接 连接 到 位 于 该 
PoP 的 一 台 路 由 器 。 任 何 ISP (除了 第 一 层 ISP) 可 以 选择 多 宿 (multi-home) ， 即 可 以 与 
两 个 或 更 多 提供 商 ISP 连接 。 例 如 ， 一 个 接 人 ISP 可 能 与 两 个 区 域 ISP 多 和 宿 ， 既 可 以 与 两 
个 区 域 ISP 多 宿 ， 也 可 以 与 一 个 第 一 层 ISP 多 宿 。 当 一 个 ISP 多 宿 时 ， 即 使 它 的 提供 商 之 
一 出 现 故障 ， 它 仍然 能 够 继续 发 送 和 接收 分 组 。 

正如 我 们 刚才 学 习 的 ， 客 户 ISP 向 它们 的 提供 商 ISP 付费 以 获得 全 球 因 特 网 互联 能 力 。 
客户 ISP 支付 给 提供 商 ISP 的 费用 数额 反映 『 它 通过 提供 商 交 换 的 通信 流量 。 为 了 减少 这 
些 费 用 ， 位 于 相同 等 级 结构 层次 的 邻近 一 对 ISP 能 够 对 等 (peer) ， 也 就 是 说 ， 能 够 直接 
将 它们 的 网 络 连 到 一 起 ， 使 它们 之 间 的 所 有 流量 经 直接 连接 而 不 是 通过 上 游 的 中 间 ISP 传 
Mo “4P ISP 对 等 时 ， 通 常 不 进行 结算 ， 即 任 一 个 ISP 不 向 其 对 等 付费 。 如 前 面 提 到 的 
那样 ， 第 一 层 ISP 也 与 另 一 个 第 一 层 ISP 对 等 ， 它 们 之 间 无 结算 。 对 于 对 等 和 客户 -提供 
商 关系 的 讨论 ，[ Van der Berg 2008] 是 一 本 不 错 的 读物 。 沿 着 这 些 相 同 路 线 ， 第 三 方 公司 
能 够 创建 一 个 因特网 交换 点 (Internet Exchange Point，IXP) ，IXP 是 一 个 汇合 点 ， 多 个 ISP 
能 够 在 这 里 一 起 对 等 。IXP 通常 位 于 一 个 有 自己 的 交换 机 的 独立 建筑 物 中 [Ager 2012], 
在 今天 的 因特网 中 有 400 多 个 IXP [IXP List 2016 ] 。 我 们 称 这 个 生态 系统 为 网 络 结 构 
4 一 一 由 接 入 ISP、 区 域 I SP、 第 一 层 IJSP、PoP 、 多 和 宿 、 对 等 和 IXP 组 成 。 

我 们 现在 最 终 到 达 了 网 络 结构 5， 它 描述 了 现今 的 因特网 。 在 图 1-15 中 显示 了 网 络 结 
构 5， 它 通过 在 网 络 结构 4 顶部 增加 内 容 提供 商 网 络 (content provider network) 构建 而 成 。 
谷歌 是 当前 这 样 的 内 容 提供 商 网络 的 一 个 突出 例子 。 在 本 书写 作 之 时 ， 谷歌 估计 有 50 ~ 
100 个 数据 中 心 分 布 于 北美 、 欧 洲 、 亚 洲 、 南 美和 澳大利亚 。 其 中 的 某 些 数据 中 心 容纳 了 


超过 十 万 台 的 服务 器 ， 而 另 一 些 数据 中 心 则 较 小 ， 仅 容纳 数 百 台 服 务 器 。 谷 歌 数据 中 心 都 
经 过 专用 的 TCP/IP 网 络 互联 ， 该 网 络 跨越 全 球 ， 不 过 独立 于 公共 因特网 。 重 要 的 是 ， 合 
歌 专用 网 络 仅 承载 出 人 谷歌 服务 器 的 流量 。 如 图 1-15 所 示 ， 谷歌 专用 网 络 通过 与 较 低层 
ISP 对 等 (无 结算 )， 尝试“ 绕 过 ”因特网 的 较 高 层 ， 采 用 的 方式 可 以 是 直接 与 它们 连接 ， 
或 者 在 IXP 处 与 它们 连接 [ Labovitz 2010 ] 。 然 而 ， 因 为 许多 接 人 ISP 仍然 仅 能 通过 第 一 层 
网 络 的 传输 到 达 ， 所 以 谷歌 网 络 也 另 第 一 层 ISP 连接 ， 并 就 与 这 些 ISP 交换 的 流量 向 它们 
付费 。 通 过 创建 自己 的 网 络 ， 内 容 提供 商 不 仅 减 少 了 向 项 层 ISP 支付 的 费用 ， 而 且 对 其 服 
务 最 终 如 何 交 付 给 端 用 户 有 了 更 多 的 控制 。 谷 歌 的 网 络 基础 设施 在 2.6 节 中 进行 了 详细 
描述 。 


内 容 提供 商 





BR BAO BA BA BA BA BA BA 
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图 1-15 ISP 的 互联 


总 结 一 下 ， 今 天 的 因特网 是 一 个 网 络 的 网 络 ， 其 结构 复杂 ， 由 十 多 个 第 一 层 ISP 和 数 
十 万 个 较 低层 ISP 组 成 。ISP 覆盖 的 区 域 多 种 多 样 ， 有 些 跨越 多 个 大 洲 和 大 洋 ， 有 些 限 于 
狭窄 的 地 理 区域 。 较 低层 的 ISP 与 较 高 层 的 ISP 相连 ， 较 高 层 ISP 彼此 互联 。 用 户 和 内 容 
提供 商 是 较 低层 IP 的 客户 ， 较 低层 ISP 是 较 高 层 IP 的 客户 。 近 年 来 ， 主 要 的 内 容 提 供 
商 也 已 经 创建 自己 的 网 络 ， 直 接 在 可 能 的 地 方 与 较 低 层 ISP 互联 。 


1.4 分 组 交换 网 中 的 时 延 、 丢 包 和 吞吐 量 


回想 在 1. 1 节 中 我 们 讲 过 ， 因 特 网 能 够 看 成 是 一 种 基础 设施 ， 该 基础 设施 为 运行 在 端 
系统 上 的 分 布 式 应 用 提供 服务 。 在 理想 情况 下 ， 我 们 希望 因特网 服务 能 够 在 任意 两 个 病 系 
统 之 间 随 心 所 欲 地 瞬间 移动 数据 而 没有 任何 数据 丢失 。 然 而 ， 这 是 一 个 极 高 的 目标 ， 实 践 
中 难以 达到 。 与 之 相反 ， 计 算 机 网 络 必定 要 限制 在 端 系统 之 间 的 吞吐 量 〈 每 秒 能 够 传送 的 
数据 量 ) ， 在 端 系统 之 间 引 入 时 延 ， 而 且 实际 上 也 会 丢失 分 组 。 一 方面 ， 现 实 世 界 的 物理 
定律 引入 的 时 延 、 丢 包 并 限制 吞吐 量 是 不 幸 的。 而 男 一 方面 ， 因 为 计算 机 网 络 存在 这 些 问 
题 ， 围 绕 如 何 去 处 理 这 些 问题 有 许多 令 人 着 迷 的 话题 ， 多 得 足以 开设 一 门 有 关 计 算 机 网 络 
方面 的 课程 ， 可 以 做 上 千 篇 博 士 论 文 ! 在 本 节 中 ， 我 们 将 开始 研究 和 量化 计算 机 网 络 中 的 
时 延 、 丢 包 和 厨 吐 量 等 问题 。 


1.4.1 分 组 交换 网 中 的 时 延 概述 
前 面 讲 过 ,分 组 从 一 台 主 机 (W) 出 发 ,通过 一 系列 路 由 器 传输 ， 在 为 一 台 主 机 
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(目的 地 ) 中 结束 它 的 历程 。 当 分 组 从 一 个 节点 (主机 或 路 由 器 ) 沿 着 这 条 路 径 到 后 继 节 
点 (主机 或 路 由 器 )， 该 分 组 在 沿途 的 每 个 节点 经 受 了 几 种 不 同类 型 的 时 延 。 这 些 时 延 最 
为 重要 的 是 节点 处 理 时 延 (nodal processing delay) 、 排 队 时 延 (queuing delay) 、 传 输 时 延 
(transmission delay) 和 传播 时 延 ( propagation delay) ， 这 些 时 延 总 体 累加 起 来 是 节点 总 时 
延 (total nodal delay) 。 许 多 因特网 应 用 ， 如 搜索 、Web 浏览 、 电 子 邮 件 、 地 图 、 即 时 讯 
息 和 IP 语 音 ， 它 们 的 性 能 受 网 络 时 延 的 影响 很 大 。 为 了 深入 理解 分 组 交换 和 计算 机 网 络 ， 
我 们 必须 理解 这 些 时 延 的 性 质 和 重要 性 。 

时 延 的 类 型 

我 们 来 探讨 一 下 图 1-16 环境 中 的 这 些 时 延 。 作 为 源 和 目的 地 之 间 的 端 到 端 路 由 的 一 
部 分 ， 一 个 分 组 从 上 游 节点 通过 路 由 器 A 向 路 由 器 B 发 送 。 我 们 的 目标 是 在 路 由 器 A Z 
夯 出 节点 时 延 。 值 得 注意 的 是 ， 路 由 器 A 具有 通 往 路 由 器 B 的 出 链 路 。 该 链 路 前 面 有 一 个 
队列 (也 称 为 缓存 )。 当 分 组 从 上 游 
节点 到 达 路 由 器 A 时 ， 路 由 器 A 检查 
该 分 组 的 首部 以 决定 它 的 适当 出 链 路 ， 
并 将 该 分 组 导 回 该 链 路 。 在 这 个 例子 
中 ， 对 该 分 组 的 出 链 路 是 通 向 路 由 需 





B 的 那 条 链 路 。 仅 当 在 该 链 路 没有 其 “ 黑 芝 S 
他 分 组 正在 传输 并 且 没 有 其 他 分 组 排 
在 该 队列 前 面 时 ， 才 能 在 这 条 链 路 上 enn 


传输 该 分 组 ; 如 果 该 链 路 当前 正 繁忙 或 有 其 他 分 组 已 经 在 该 链 路 上 排队 ， 则 新 到 达 的 分 组 
将 加 入 排队 。 

(1) 处 理 时 延 

检查 分 组 首部 和 决定 将 该 分 组 导向 何 处 所 需要 的 时 间 是 处 理 时 延 的 一 部 分 。 处 理 时 延 
也 能 够 包括 其 他 因素 ， 如 检查 比特 级 别 的 差错 所 需要 的 时 间 ， 该 差错 出 现在 从 上 游 节 点 向 
路 由 器 A 传输 这 些 分 组 比特 的 过 程 中 。 高 速 路 由 器 的 处 理 时 延 通 常 是 微 秒 或 更 低 的 数量 
级 。 在 这 种 节点 处 理 之 后 ， 路 由 器 将 该 分 组 引 向 通 往 路 由 器 B 链 路 之 前 的 队列 。 (在 第 4 
章 中 ， 我 们 将 研究 路 由 需 运 行 的 细节 ) 

(2) 排队 时 延 

在 队列 中 ， 当 分 组 在 链 路 上 等 待 传 输 时 ， 它 经 受 排队 时 延 。 一 个 特定 分 组 的 排队 时 延长 
度 将 取决 于 先期 到 达 的 正在 排队 等 待 向 链 路 传输 的 分 组 数量 。 如 果 该 队列 是 空 的 ， 并 且 当 前 
没有 其 他 分 组 正在 传输 ， 则 该 分 组 的 排队 时 延 为 0。 另 一 方面 ， 如 果 流 量 很 大 ， 并 且 许 多 其 
他 分 组 也 在 等 竺 传输， 该 排队 时 延 将 很 长 。 我 们 将 很 快 看 到 ， 到 达 分 组 期 待 发 现 的 分 组 数量 
是 到 达 该 队列 的 流量 的 强度 和 性 质 的 函数 。 实 际 的 排队 时 延 可 以 是 毫秒 到 微 秒 量 级 。 

(3) 传输 时 延 

假定 分 组 以 先 到 先 服务 方式 传输 一 一 这 在 分 组 交换 网 中 是 常见 的 方式 ， 仅 当 所 有 已 经 
到 达 的 分 组 被 传输 后 ， 才 能 传输 刚 到 达 的 分 组 。 用 工 比特 表示 该 分 组 的 长 度 ， 用 R bps 
(Bl b/s) 表示 从 路 由 器 A 到 路 由 器 B 的 链 路 传输 速率 。 例 如 ， 对 于 一 条 10Mbps 的 以 太 网 
链 路 ， 速 率 R=10Mbps; 对 于 100Mbps 的 以 太 网 链 路 ， 速 率 R =100Mbps。 传 输 时 延 是 L/ 
R。 这 是 将 所 有 分 组 的 比特 推 向 链 路 ( 即 传 输 ， 或 者 说 发 射 ) 所 需要 的 时 间 。 实 际 的 传输 
时 延 通常 在 毫秒 到 微 秒 量 级 。 


(4) 传播 时 延 

一 且 一 个 比特 被 推 向 链 路 ， 该 比特 需要 向 路 由 器 B 传播 。 从 该 链 路 的 起 点 到 路 由 器 B 
传播 所 需要 的 时 间 是 传播 时 延 。 该 比特 以 该 链 路 的 传播 速率 传播 。 该 传播 速率 取决 于 该 链 
路 的 物理 媒体 ( 即 光纤 、 双 绞 铜 线 等 )， 其 速率 范围 是 2 x 10 ~3 x10 m/s， 这 等 于 或 略 小 
于 光速 。 该 传播 时 延 等 于 两 台 路 由 器 之 间 的 距离 除 以 传播 速率 。 即 传播 时 延 是 ds， 其 中 
d 是 路 由 紫 A 和 路 由 器 B 之 间 的 距离 ，s 是 该 链 路 的 传播 速率 。 一 旦 该 分 组 的 最 后 一 个 比 
特 传播 到 节点 B， 该 比特 及 前 面 的 所 有 比特 被 存储 于 路 由 器 B。 整 个 过 程 将 随 着 路 由 器 B 
执行 转发 而 持续 下 去 。 在 广域网 中 ， 传 播 时 延 为 毫秒 量 级 。 

(5) 传输 时 延 和 传播 时 延 的 比较 | 

计算 机 网 络 领域 的 新 手 有 时 难以 理解 传输 时 延 和 传播 时 延 之 间 的 差异 。 该 差异 是 微妙 
而 重要 的 。 传 输 时 延 是 路 由 器 推出 分 组 所 需要 的 时 间 ， 它 是 分 组 长 度 和 链 路 传输 速率 的 函 
数 ， 而 与 两 台 路 由 器 之 间 的 距离 无 关 。 另 一 方面 ， 传 播 时 延 是 一 个 比特 从 一 台 路 由 器 传播 
到 男 一 台 路 由 器 所 需要 的 时 间 ， 它 是 两 台 路 由 器 之 间距 离 的 函数 ， 而 与 分 组 长 度 或 链 路 传 
输 速率 无 关 。 

一 个 类 比 可 以 阐明 传输 时 延 和 传播 时 延 的 概念 。 考 虑 一 条 公路 每 100km 有 一 个 收费 
站 ， 如 图 1-17 所 示 。 可 认为 收费 站 间 的 公路 段 是 链 路 ， 收 费 站 是 路 由 器 。 假 定 汽 车 以 
100km/h 的 速度 (也 就 是 说 当 一 辆 汽车 离开 一 个 收费 站 时 ， 它 立即 加 速 到 100kmvh 并 在 收 
费 站 间 维 持 该 速度 ) 在 该 公路 上 行驶 〈 即 传播 ) 。 假 定 这 时 有 10 辆 汽车 作为 一 个 车 队 在 行 
驶 ， 并 且 这 10 辆 汽车 以 固定 的 顺序 互相 跟随 。 可 以 认为 每 辆 汽车 是 一 个 比特 ， 该 车 队 是 
一 个 分 组 。 同 时 假定 每 个 收费 站 以 每 辆 车 12s 的 速度 服务 ( 即 传输 ) 一 辆 汽车 ， 并 且 由 于 
时 间 是 深夜 ， 因 此 该 车 队 是 公路 上 唯一 一 批 汽车 。 最 后 ， 假 定 无 论 该 车 队 的 第 一 辆 汽车 何 
时 到 达 收 费 站 ， 它 在 入 口 处 等 待 ， 直 到 其 他 9 辆 汽车 到 达 并 整 队 依次 前 行 。( 因此， 整个 
车 队 在 它 能 够 “转发 ”之 前 ， 必 须 存储 在 收费 站 。) 收费 站 将 整个 车 队 推 向 公路 所 需要 的 
时 间 是 (10 辆 车 )/(5 辆 车 /min) =2min。 该 时 间 类 比 于 一 台 路 由 器 中 的 传输 时 延 。 一 辆 
汽车 从 一 个 收费 站 出 口 行驶 到 下 一 个 收费 站 所 需要 的 时 间 是 100km (100km/h) =1h。 这 
个 时 间 类 比 于 传播 时 延 。 因 此 ， 从 该 车 队 存 储 在 收费 站 前 到 该 车 队 存储 在 下 一 个 收费 站 前 
的 时 间 是 “传输 时 延 ” 与 “传播 时 间 ” 总 和 ， 在 本 例 中 为 62min, 


-要 +—- 100km --- 
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10 辆 汽车 的 车 队 收费 站 收费 站 
图 1-17 车 队 的 类 比 


我 们 更 深入 地 探讨 一 下 这 个 类 比 。 如 果 收 费 站 对 车 队 的 服务 时 间 大 于 汽车 在 收费 站 之 
间 行 驶 的 时 间 ， 将 会 发 生 什么 情况 呢 ? 例如 ， 假 定 现 在 汽车 是 以 1000km/h 的 速率 行驶 ， 
收费 站 是 以 每 分 钟 一 辆 汽车 的 速率 为 汽车 服务 。 则 汽车 在 两 个 收费 站 之 间 的 行驶 时 延 是 
6min， 收 费 站 为 车 队 服 务 的 时 间 是 10min。 在 此 情况 下 ， 在 该 车 队 中 的 最 后 几 辆 汽车 离开 
第 一 个 收费 站 之 前 ， 该 车 队 中 前 面 的 几 辆 汽车 将 会 达到 第 二 个 收费 站 。 这 种 情况 在 分 组 交 
换 网 中 也 会 发 生 ， 一 个 分 组 中 的 前 几 个 比特 到 达 了 一 台 路 由 器 ， 而 该 分 组 中 许多 余下 的 比 
特 仍 然 在 前 面 的 路 由 需 中 等 待 传输 。 

如 果 说 一 图 胜 千言 的 话 ， 则 一 个 动画 必定 胜 百 万 言 。 与 本 书 配 套 的 Web 网 站 提供 了 
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一 个 交互 式 Java 小 程序 ， 它 很 好 地 展现 及 对 比 了 传输 时 延 和 传播 时 延 。 我 们 极力 推荐 读者 
访问 该 Java 小 程序 。[ Smith 2009] 也 提供 了 可 读 性 很 好 的 有 关 传 播 、 排 队 和 传输 时 延 的 
讨论 。 

MRS dooce  、d 和 也。 分 别 表 示 处 理 时 延 、 排 队 时 延 、 传 输 时 延 和 传播 时 延 ， 
则 节点 的 总 时 延 由 下 式 给 定 : 

s RE d roc +d dag T dau + d a 

这 些 时 延 成 分 所 起 的 作用 可 能 会 有 很 大 的 不 同 。 例 如 ， 对 于 连接 两 台 位 于 同一 个 大 学 
校园 的 路 由 器 的 链 路 而 言 ，d, 可 能 是 微不足道 的 (例如 ， 几 微 秒 ) ; 然而 ,对 于 由 同步 
卫星 链 路 互联 的 两 台 路 由 器 来 说 ，d,, 是 几 百 毫秒 ， 能 够 成 为 dw 中 的 主要 成 分 。 类 似 
地 ，di 的 影响 可 能 是 微不足道 的 ， 也 可 能 是 很 大 的 。 通 常 对 于 10Mbps 和 更 高 的 传输 束 
率 (例如 ， 对 于 LAN) 的 信道 而 言 ， 它 的 影响 是 微不足道 的 ;然而 ， 对 于 通过 低速 拨号 
调制 解 调 器 链 路 发 送 的 长 因特网 分 组 而 言 ， 可 能 是 数 百 毫秒 。 处 理 时 延 d,,, 通 常 是 微 不 足 
道 的 ; 然而 ， 它 对 一 台 路 由 器 的 最 大 吞吐 量 有 重要 影响 ， 最 大 吞吐 量 是 一 台 路 由 器 能 够 转 
发 分 组 的 最 大 速率 。 


1.4.2 排队 时 延 和 丢 包 


节点 时 延 的 最 为 复杂 和 有 趣 的 成 分 是 排队 时 延 d,,,,.。 事 实 上 ， 排队 时 延 在 计算 机 网 络 
中 的 重要 程度 及 人 们 对 它 感 兴趣 的 程度 ， 从 发 表 的 数 以 千 计 的 论文 和 大 量 专著 的 情况 可 见 
一 斑 | Bertsekas 1991; Daigle 1991; Kleinrock 1975, 1976; Ross 1995 ] 。 我 们 这 里 仅 给 出 
有 关 排 队 时 延 的 总 体 的 、 直 觉 的 讨论 ; 求知 欲 强 的 读者 可 能 要 浏览 某 些 书籍 〈 或 者 最 终 写 
有 关 这 方面 的 博士 论文 ) 。 与 其 他 3 项 时 延 CBN dos Cans dpo) 不 同 的 是 ， 排 队 时 延 对 
不 同 的 分 组 可 能 是 不 同 的 。 例 如 ， 如 果 10 个 分 组 同时 到 达 空 队列 ， 传 输 的 第 一 个 分 组 没 
有 排队 时 延 ， 而 传输 的 最 后 一 个 分 组 将 经 受 相 对 大 的 排队 时 延 (这 时 它 要 等 待 其 他 9 个 分 
组 被 传输 )。 因 此 ， 当 表征 排队 时 延 时 ， 人 们 通常 使 用 统计 量 来 度量 ， 如 平均 排队 时 延 、 
排队 时 延 的 方差 和 排队 时 延 超过 某 些 特定 值 的 概率 。 

什么 时 候 排队 时 延 大 ， 什 么 时 候 又 不 大 呢 ? 该 问题 的 答案 很 大 程度 取决 于 流量 到 达 该 
队列 的 速率 、 链 路 的 传输 速率 和 到 达 流 量 的 性 质 ， 即 流量 是 周期 性 到 达 还 是 以 突 发 形式 到 
达 。 为 了 更 深入 地 领会 某 些 要 点 , 令 a 表示 分 组 到 达 队 列 的 平均 速率 (a 的 单位 是 分 组 / 
秒 ， 即 pkt/s)。 前 面 讲 过 R 是 传输 速率 ， 即 从 队列 中 推出 比特 的 速率 (以 bps BI b/s 为 单 
位 )。 为 了 简单 起 见 ， 也 假定 所 有 分 组 都 是 由 工 比特 组 成 的 。 则 比特 到 达 队 列 的 平均 速率 
是 La bps。 最 后 ,假定 该 队列 非常 大 ， 因 此 它 基 本 能 容纳 无 限 数量 的 比特 。 比 率 La/R 被 
称 为 流量 强度 (traffic intensity) ， 它 在 估计 排队 时 延 的 范围 方面 经 党 起 着 重要 的 作用 。 如 
果 La/R >1， 则 比特 到 达 队 列 的 平均 速率 超过 从 该 队列 传输 出 去 的 速率 。 在 这 种 不 幸 的 情 
况 下 ， 该 队列 趋向 于 无 限 增加 ， 并 且 排 队 时 延 将 趋向 无 穷 大 ! 因此 ,流量 工程 中 的 一 条 金 
科 玉 律 是 : 设计 系统 时 流量 强度 不 能 大 于 1。 

现在 考虑 La/R<1 时 的 情况 。 这 时 ， 到 达 流 量 的 性 质 影响 排队 时 延 。 例 如 ， 如 果 分 组 
周期 性 到 达 ， 即 每 L/R 秒 到 达 一 个 分 组 ， 则 每 个 分 组 将 到 达 一 个 空 队列 中 ,不 会 有 排队 时 
延 。 男 一 方面 ， 如 果 分 组 以 突 发 形式 到 达 而 不 是 周期 性 到 达 ， 则 可 能 会 有 很 大 的 平均 排队 
时 延 。 例 如 ， 假 定 每 (LAR)N 秒 同 时 到 达 N 个 分 组 。 则 传输 的 第 一 个 分 组 没有 排队 时 延 ; 
传输 的 第 二 个 分 组 就 有 L/R 秒 的 排队 时 延 ; 更 为 一 般 地 ， 第 n 个 传输 的 分 组 具有 ( -1) 
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L/R 秒 的 排队 时 延 。 我 们 将 该 例子 中 的 计算 平均 排队 时 延 的 问题 留 给 读者 作为 练习 ，。 

以 上 描述 周期 性 到 达 的 两 个 例子 有 些 学 术 味 。 通 常 ， 到 达 队 列 的 过 程 是 随机 的 ， 即 到 
达 并 不 遵循 任何 模式 ， 分 组 之 间 的 时 间 间 隔 是 随机 的 。 在 这 种 更 为 真实 的 情况 下 ， 量 La/ 
及 通常 不 足以 全 面 地 表征 时 延 的 统计 量 。 不 过 ， 直 观 地 理解 排队 时 延 的 范围 很 有 用 。 特 别 
是 ， 如 果 流 量 强度 接近 于 0， 则 几乎 没有 分 组 到 达 并 且 到 达 间 隔 很 大 ， 那 么 到 达 的 分 组 将 
不 可 能 在 队列 中 发 现 别 的 分 组 。 因 此 ,平均 排队 时 延 将 接近 0。 男 一 方面 ， 当 流量 强度 接 
近 1 时 ， 当 到 达 速 率 超过 传输 能 力 (由 于 分 组 到 达 速 率 的 波动 ) 时 将 存在 时 间 间 隔 ， 在 这 
些 时 段 中 将 形成 队列 。 当 到 达 速 率 小 于 传输 能 力 时 ， 
队列 的 长 度 将 缩短 。 无 论 如 何 ， 随 着 流量 强度 接近 1， 
平均 排队 长 度 变 得 越 来 越 长 。 平 均 排 队 时 延 与 流量 强 
度 的 定性 关系 如 图 1-18 所 示 。 

图 1-18 的 一 个 重要 方面 是 这 样 一 个 事实 : BA 
流量 强度 接近 于 1， 平均 排队 时 延 迅 速 增加 。 该 强度 
的 少量 增加 将 导致 时 延 大 比例 增加 。 也 许 你 在 公路 上 
经 历 过 这 种 事 。 如 果 在 经 常 拥塞 的 公路 上 像 平时 一 样 
驾驶 ， 这 条 路 经 党 拥塞 的 事实 意味 着 它 的 流量 强度 接 


平均 排队 时 延 





| 
| 
| 
| 
| 
| 
| 
| 
| 
| 
| 
| 
| 
| 
| 
| 
| 
| 
| 
| 
l 


AF1, WREEF ee — PS BNET KT OE Lain 
量 的 流量 ， 经 受 的 时 延 就 可 能 很 大 。 图 1-18 平均 排队 时 延 与 
为 了 实际 感受 一 下 排队 时 延 的 情况 ， 我 们 再 次 鼓 流量 强度 的 关系 


励 你 访问 本 书 的 Web 网 站 ,该 网 站 提供 了 一 个 有 关 队 列 的 交互 式 Java 小 程序 。 如 果 你 将 
分 组 到 达 速 率 设置 得 足够 大 ， 使 流量 强度 超过 1， 那么 将 看 到 经 过 一 段 时 间 后 ， 队 列 慢 慢 
地 建立 起 来 。 

Fy 

在 上 述 讨论 中 ,我 们 已 经 假设 队列 能 够 容纳 无 穷 多 的 分 组 。 在 现实 中 ,一 条 链 路 前 的 
队列 只 有 有 限 的 容量 ， 尽 管 排 队 容 量 极 大 地 依赖 于 路 由 器 设计 和 成 本 。 因 为 该 排队 容量 是 
有 限 的 ， 随 着 流量 强度 接近 1 ， 排 队 时 延 并 不 真正 趋向 无 穷 大 。 相 反 ， 到 达 的 分 组 将 发 现 
一 个 满 的 队列 。 由 于 没有 地 方 存储 这 个 分 组 ， 路 由 颖 将 丢弃 (drop) 该 分 组 ， 即 该 分 组 将 
会 丢失 (lost) 。 当 流量 强度 大 于 1 时 ， 队 列 中 的 这 种 溢出 也 能 够 在 用 于 队列 的 Java 小 程序 
中 看 到 。 

从 端 系 统 的 角度 看 ， 上 述 丢 包 现 象 看 起 来 是 一 个 分 组 已 经 传输 到 网 络 核 心 ， 但 它 绝 不 
会 从 网 络 发 送 到 目的 地 。 分 组 丢失 的 比例 随 看 流量 强度 增加 而 增加 。 因 此 ， 一 个 市 点 的 性 
能 常常 不 仅 根 据 时 延 来 度量 ， 而 且 根据 丢 包 的 概率 来 度量 。 正 如 我 们 将 在 后 面 各 章 中 讨论 
的 那样 ， 丢 失 的 分 组 可 能 基于 端 到 端的 原则 重 传 ， 以 确保 所 有 的 数据 最 终 从 源 传送 到 了 目 
的 地 。 


1.4.3 端 到 端 时 延 


前 面 的 讨论 一 直 集 中 在 节点 时 延 上 ， 即 在 单 台 路 由 关上 的 时 延 。 我 们 现在 考虑 从 源 到 
目的 地 的 总 时 延 。 为 了 能 够 理解 这 个 概念 ， 假 定 在 源 主 机 和 目的 主机 之 间 有 N-1 台 路 由 
器 。 我 们 还 要 假设 该 网 络 此 时 是 无 拥塞 的 〈 因 此 排队 时 延 是 微不足道 的 ) ， 在 每 台 路 由 带 
和 源 主机 上 的 处 理 时 延 是 du..， 每 台 路 由 器 和 源 主机 的 输出 速率 是 R bps， 每 条 链 路 的 传 
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dedama = N, d ma E Aana F ip) (1-2) 
同样 ， 式 中 d=LAR， 其 中 上 是 分 组 长 度 。 值 得 注意 的 是 , 式 (1-2) ÆA (1-1) 的 一 
般 形式 , sh (1-1) 没有 考虑 处 理 时 延 和 传播 时 延 。 在 各 节点 具有 不 同 的 时 延 和 每 个 节点 
存在 平均 排队 时 延 的 情况 下 ， 需 要 对 式 (1-2) 进行 一 般 化 处 理 。 我 们 将 有 关 工 作 留 给 
读者 。 


1. Traceroute 


为 了 对 计算 机 网 络 中 的 端 到 端 时 延 有 第 一 手 认 识 ， 我 们 可 以 利用 Traceroute 程序 。 
Traceroute 是 一 个 简单 的 程序 ， 它 能 够 在 任何 因特网 主机 上 运行 。 当 用 户 指定 一 个 目的 主 
机 名 字 时 ， 源 主机 中 的 该 程序 朝 着 目的 地 发 送 多 个 特殊 的 分 组 。 当 这 些 分 组 向 着 目的 地 传 
送 时 ， 它 们 通过 一 系列 路 由 器 。 当 路 由 器 接收 到 这 些 特殊 分 组 之 一 时 ， 它 同 源 回 送 一 个 短 
报 文 。 该 短 报 文 包 括 路 由 需 的 名 字 和 地 址 。 

更 具体 的 是 ， 假 定 在 源 和 目的 地 之 间 有 N -1 台 路 由 器 。 源 将 向 网 络 发 送 ON 个 特殊 的 
分 组 ， 其 中 每 个 分 组 地 址 指向 最 终 目 的 地 。 这 NN 个 特殊 分 组 标识 为 从 1 到 N， 第 一 个 分 组 
标识 为 1， 最 后 的 分 组 标识 为 N。 当 第 n 台 路 由 器 接收 到 标识 为 n 的 第 个 分 组 时 ,该 路 
由 需 不 是 回 它 的 目的 地 转发 该 分 组 ， 而 是 向 源 回 送 一 个 报 文 。 当 目的 主机 接收 第 V 个 分 组 
时 ， 它 也 会 回 源 返 回 一 个 报 文 。 该 源 记 录 了 从 它 发 送 一 个 分 组 到 它 接 收 到 对 应 返回 报 文 所 
经 历 的 时 间 ; 它 也 记录 了 返回 该 报 文 的 路 由 右 (或 目的 主机 ) 的 名 字 和 地 址 。 以 这 种 方 
式 ， 源 能 够 重建 分 组 从 源 到 目的 地 所 采用 的 路 由 ， 并 且 该 源 能 够 确定 到 所 有 中 间 路 由 器 的 
往返 时 延 。Traceroute 实际 上 对 刚才 描述 的 实验 重复 了 3 次 ， 因 此 该 源 实 际 上 回 目 的 地 发 
送 了 3 xN 个 分 组 。RFC 1393 详细 地 描述 了 Traceroute, 

这 里 有 一 个 Traceroute 程序 输出 的 例子 ， 其 中 追踪 的 路 由 从 源 主 机 gaia. cs. umass. edu 
(位 于 马 院 诸 塞 大 学 ) 到 cis. poly. edu (位 于 布鲁克 林 的 理工 大 学 ) 。 输 出 有 6 列 : 第 一 列 
-是 前 面 描述 的 n 值 ， 即 路 径 上 的 路 由 器 编号 ; 第 二 列 是 路 由 器 的 名 字 ; 第 三 列 是 路 由 器 地 
址 (格式 为 xxx. xxx. xxx. xxx); 最 后 3 列 是 3 次 实验 的 往返 时 延 。 如 果 源 从 任何 给 定 路 由 
需 接 收 到 的 报 文 少 于 3 条 (由 于 网 络 中 的 丢 包 ) Traceroute 在 该 路 由 器 号 码 后 面 放 一 个 星 
号 ， 并 辐 那 台 路 由 顺 报 告 少 于 3 次 往返 时 间 。 


cs-gw (128.119.240.254) 1.009 ms 0.899 ms 0.993 ms 

128, 119434194 (126.119.3.154) 0.931 ms: 0.441. ms 0.651. ms 
-border4-rt-gi-1-3.gw.umass.edu (128.119.2.194) 1.032 ms 0.484 ms 0.451 ms 
-acrl-ge-2-1-0.Boston.cw.net (208.172.51.129) 10.006 ms 8.150 ms 8.460 ms 
-agr4-loopback.NewYork.cw.net (206.24.194.104) 12.272 ms 14.344 ms 13.267 ms 
-acr2-loopback.NewYork.cw.net (206.24.194.62) 13.225 ms 12.292 ms 12.148 ms 
-pos10-2.core2.NewYork1.Level3.net (209.244.160.133) 12.218 ms 11.823 ms 11.793 ms 
-gige9-1-52 .hsipaccess1 .NewYorkl .Level3.net (64.159.17.39) 13.081 ms 11.556 ms 13.297 ms 
-p0-0.polyu.bbnplanet.net (4.25.109.122) 12.716 ms 13.052 ms 12.786 ms 

0 cis.poly.edu (128.238.32.126) 14.080 ms 13.035 ms 12.802 ms 


在 上 述 跟 踩 中 ， 在 源 和 目的 之 间 有 9 台 路 由 器 。 这 些 路 由 器 中 的 多 数 有 一 个 名 字 ， 所 
有 都 有 地 址 。 人 例如， 路 由 器 3 的 名 字 是 border4- rt- gi- 1-3. gw. umass. edu， 它 的 地 址 是 
128. 119. 2. 194。 看 看 为 这 人 台 路 由 需 提 供 的 数据 ， 可 以 看 到 在 源 和 路 由 器 之 间 的 往返 时 延 : 
3 次 实验 中 的 第 一 次 是 1.03ms， 后 继 两 次 实验 的 往返 时 延 是 0.48ms 和 0. 4Sms。 这 些 往返 
时 延 包 括 刚才 讨论 的 所 有 时 延 ， 即 包括 传输 时 延 、 传 播 时 延 、 路 由 器 处 理 时 延 和 排队 时 
延 。 因 为 该 排队 时 延 随时 间 变 化 ， 所 以 分 组 n 发 送 到 路 由 需 半 的 往返 时 延 实 际 上 可 能 比分 
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组 +1 发 送 到 路 由 器 m+1l 的 往返 时 延 更 长 。 的 确 ， 我 们 在 上 述 例子 中 观察 到 了 这 种 现象 : 
到 路 由 需 6 的 时 延 比 到 路 由 器 7 的 更 大 ! 

你 想 自 己 试 试 Traceroute 程序 吗 ?” 我 们 极力 推荐 你 访问 http://www. traceroute. org ， 它 
的 Web 界面 提供 了 有 关 路 由 跟踪 的 大 量 源 列 表 。 你 选择 一 个 源 ， 并 提供 任何 目的 地 的 主 
机 名 ， 该 Traceroute 程序 则 会 完成 所 有 工作 。 有 许多 为 Traceroute 提供 图 形 化 界面 的 免费 软 
件 ， 其 中 我 们 喜爱 的 一 个 程序 是 PingPlotter| PingPlotter 2016 | 。 

2. 端 系 统 、 应 用 程序 和 其 他 时 延 

除了 处 理 时 延 、 传 输 时 延 和 传播 时 延 ， 端 系统 中 还 有 其 他 一 些 重要 时 延 。 例 如 ,希望 
向 共享 媒体 (例如 在 WiFi 或 电缆 调制 解 调 器 情况 下 ) 传输 分 组 的 端 系 统 可 能 有 意 地 延迟 
它 的 传输 ， 把 这 作为 它 与 其 他 端 系 统 共享 媒体 的 协议 的 一 部 分 ; 我 们 将 在 第 6 章 中 详细 地 
考虑 这 样 的 协议 。 男 一 个 重要 的 时 延 是 媒体 分 组 化 时 延 ， 这 种 时 延 出 现在 IP 语音 (VolP) 
应 用 中 。 在 VoIP 中 ， 发 送 方 在 向 因特网 传递 分 组 之 前 必须 首先 用 编码 的 数字 化 语音 填充 
一 个 分 组 。 这 种 填充 一 个 分 组 的 时 间 称 为 分 组 化 时 延 ， 它 可 能 较 大 ， 并 能 够 影响 用 户 感 受 
到 的 VoIP 呼叫 的 质量 。 这 个 问题 将 在 本 草 绪 束 的 课 后 作业 中 进一步 探讨 。 


1.4.4 计算 机 网 络 中 的 吞吐 量 


除了 时 延 和 丢 包 ， 计 算 机 网 络 中 另 一 个 至 关 重 要 的 性 能 测度 是 端 到 端 吞 吐 量 。 为 了 定 
义 吞 吐 量 ， 考 虑 从 主机 A 到 主机 B 跨越 计算 机 网 络 传送 一 个 大 文件 。 例 如 ， 也 许 是 从 一 个 
P2P 文件 共享 系统 中 的 一 个 对 等 方向 另 一 个 对 等 方 传送 一 个 大 视频 片段 。 在 任何 时 间 瞬 间 
的 瞬时 吞吐 量 (instantaneous throughput) 是 主机 B 接收 到 该 文件 的 速率 (以 bps 计 )。( 许 
多 应 用 程序 包括 许多 PP 文件 共享 系统 ， 其 用 户 界 面 显示 了 下 载 期 间 的 瞬时 吞吐 量 ， 也 许 
你 以 前 已 经 观察 过 它 !) 如 果 该 文件 由 下 比特 组 成 ， 主 机 了 接收 到 所 有 F 比特 用 去 7 了 秒 ， 
则 文件 传送 的 平均 吞吐 量 (average throughput) 是 F/T bps。 对 于 某 些 应 用 程序 如 因特网 电 
话 ， 和 希望 具有 低 时 延 和 在 某 个 冰 值 之 上 (例如 ， 对 某 些 因特网 电话 是 超过 24kbps， 对 某 些 
实时 视频 应 用 程序 是 超过 256kbps) 的 一 致 的 瞬时 吞吐 量 。 对 于 其 他 应 用 程序 ， 包 括 涉及 
文件 传送 的 那些 应 用 程序 ， 时 延 不 是 决定 性 的 ， 但 是 希望 具有 尽 可 能 高 的 吞吐 量 。 

为 了 进一步 深入 理解 否 吐 量 这 个 重要 概念 ， 我们 考虑 几 个 例子 。 图 1-19a 显示 了 服务 
器 和 客户 这 两 个 端 系统 ， 它 们 由 两 条 通信 链 路 和 一 台 路 由 器 相连 。 考 虑 从 服务 需 传 送 一 个 
文件 到 客户 的 吞吐 量 。 令 R, 表示 服务 器 与 路 由 器 之 间 的 链 路 速率 ; R. 表示 路 由 融 与 客户 
之 间 的 链 路 速率 。 假 定 在 整个 网 络 中 只 有 从 该 服务 器 到 客户 的 比特 在 传送 。 在 这 种 理想 的 
情况 下 ， 我 们 要 问 该 服务 器 到 客户 的 吞吐 量 是 多 少 ? 为 了 回答 这 个 问题 ， 我 们 可 以 想象 比 
特 是 流体 ， 通 信 链 路 是 管道 。 显 然 ， 这 台 服 务 器 不 能 以 快 于 R, bps 的 速率 通过 其 链 路 注 
入 比特 ; 这 台 路 由 器 也 不 能 以 快 于 R, bps 的 速率 转发 比特 。 如 果 R, <R., WHEAENE 
Itt R, bps 的 情况 下 ， 由 该 服务 器 注入 的 比特 将 顺畅 地 通过 路 由 希 “ 流 动 " ， 并 以 速率 
R, bps 到 达 客 户 。 男 一 方面 ， 如 果 R. < R,.， 则 该 路 由 器 将 不 能 像 接 收 速率 那样 快 地 转发 
比特 。 在 这 种 情况 下 ， 比 特 将 以 速率 R, 离开 该 路 由 右 ， 从 而 得 到 端 到 端 否 吐 量 R.o 
(还 要 注意 的 是 ， 如 果 比 特 继续 以 速率 R 到 达 路 由 器 ， 继 续 以 R. 离开 路 由 需 的 话 ， 在 
该 路 由 器 中 等 待 传输 给 客户 的 积压 比特 将 不 断 增 加 ， 这 是 一 种 最 不 希望 的 情况 !) 因此 ， 
对 于 这 种 简单 的 两 链 路 网 络 ， 其 吞吐 量 是 min | R.，R.| ， 这 就 是 说 ， 它 是 瓶颈 链 路 
(bottleneck link) 的 传输 速率 。 在 决定 了 吞吐 量 之 后 ,我 们 现在 近似 地 得 到 从 服务 器 到 
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客户 传输 一 个 F 比特 的 大 文件 所 需要 的 时 间 是 fF/min| R.，R,| 。 举 一 个 特定 的 例子 ， 假 
定 你 正在 下 载 一 个 下 =32 x 10 比特 的 MP3 文件 ， 服 务 器 具有 R, =2Mbps 的 传输 速率 ， 
并 且 你 有 一 条 R, =1Mbps 的 接 入 链 路 。 则 传输 该 文件 所 需 的 时 间 是 32 秒 。 当 然 ， 这 些 
否 吐 量 和 传输 时 间 的 表达 式 仅 是 近似 的 ， 因 为 它们 并 没有 考虑 存储 转发 、 处 理 时 延 和 协 
议 等 问题 。 





图 1-19 ”一 个 文件 从 服务 器 传送 到 客户 的 吞吐 量 


图 1-19b 此 时 显示 了 一 个 在 服务 器 和 客户 之 间 具有 N 条 链 路 的 网 络 ， 这 NN 条 链 路 的 传 
输 速率 分 别 是 尺 ，R ，…，Rv。 应 用 对 两 条 链 路 网 络 的 分 析 方 法 ， 我 们 发 现 从 服务 器 到 
客户 的 文件 传输 吞吐 量 是 min1R ，RP ，…，Rw| ， 这 同样 仍 是 沿 着 服务 器 和 客户 之 间 路 径 
的 瓶颈 链 路 的 速率 。 

现在 考虑 由 当前 因特网 所 引发 的 另 一 个 例子 。 图 1-20a 显示 了 与 一 个 计算 机 网 络 相连 
的 两 个 端 系统 : 一 台 服 务 器 和 一 个 客户 。 考 虑 从 服务 器 向 客户 传送 一 个 文件 的 吞吐 量 。 服 
务 器 以 速率 为 R, 的 接 人 链 路 与 网 络 相连 ， 且 客户 以 速率 为 及 . 的 接 入 链 路 与 网 络 相 连 。 现 
在 假定 在 通信 网 络 核心 中 的 所 有 链 路 具有 非常 高 的 传输 速率 ， 即 该 速率 比 R, A R 要 高 得 
多 。 目 前 因特网 的 核心 的 确 超 量 配置 了 高 速率 的 链 路 ， 从 而 很 少 出 现 拥塞 。 同 时 假定 在 整 
个 网 络 中 发 送 的 比特 都 是 从 该 服务 器 到 该 客户 。 在 这 个 例子 中 ， 因 为 计算 机 网 络 的 核心 就 
像 一 个 粗大 的 管子 ， 所 以 比特 从 源 向 目的 地 的 流动 速率 仍 是 R, AR, 中 的 最 小 者 ， 即 吞吐 
量 = min|R.，R.| 。 因 此 ， 在 今天 因特网 中 对 吞吐 量 的 限制 因素 通常 是 接 入 网 。 

作为 最 后 一 个 例子 ， 考 虑 图 1-20b， 其 中 有 10 台 服 务 器 和 10 个 客户 与 某 计 算 机 网 络 
核心 相连 。 在 这 个 例子 中 ， 同 时 发 生 10 个 下 载 ， 涉 及 10 个 客户 - 服务 器 对 。 假 定 这 10 
个 下 载 是 网 络 中 当时 的 唯一 流量 。 如 该 图 所 示 ， 在 核心 中 有 一 条 所 有 10 个 下 载 通过 的 链 
路 。 将 这 条 链 路 R 的 传输 速率 表示 为 R。 假 定 所 有 服务 器 接 入 链 路 具有 相同 的 速率 R.， 所 
有 客户 接 入 链 路 具有 相同 的 速率 R.， 并 且 核 心中 除了 速率 为 R 的 一 条 共同 链 路 之 外 的 所 
有 链 路 ， 它 们 的 传输 速率 都 比 RR 和 R 大 得 多 。 现 在 我 们 要 问 ， 这 种 下 载 的 否 吐 量 是 
多 少 ? 显然 ， 如 果 该 公共 链 路 的 速率 R 很 大 ， 比 如 说 比 R, ALR, 大 100 倍 ， 则 每 个 下 载 的 
吞吐 量 将 仍然 是 min| R.，R.| 。 但 是 如 果 该 公共 链 路 的 速率 与 R, AR, 有 相同 量 级 会 怎样 
呢 ? 在 这 种 情况 下 其 吞吐 量 将 是 多 少 呢 ? 让 我 们 观察 一 个 特定 的 例子 。 假 定 R, =2Mbps， 
R. =1Mbps，R =5Mbps， 并 且 公 共 链 路 为 10 个 下 载 平 等 划分 它 的 传输 速率 。 这 时 每 个 下 
载 的 瓶颈 不 再 位 于 接 人 网 中 ， 而 是 位 于 核心 中 的 共享 链 路 了 ， 该 瓶颈 仅 能 为 每 个 下 载 提 供 
500kbps 的 吞吐 量 。 因 此 每 个 下 载 的 端 到 端 吞 吐 量 现在 减少 到 500kbps。 


10 个 服务 器 





10 个 客户 
a) 客户 从 服务 器 下 载 一 个 文件 b) 10 个 客户 从 10 个 服务 器 下 载 文 件 
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图 1-19 和 图 1-20 fF BP KAA ak Dit EB YF RTE R 
当 没有 其 他 干扰 流量 时 ， 其 吞吐 量 能 够 近似 为 沿 着 源 和 目的 地 之 间 路 径 的 最 小 传输 速率 。 
图 1-20b 中 的 例子 更 一 般 地 说 明了 厨 吐 量 不 仅 取决 于 沿 着 路 径 的 传输 速率 ， 而 且 取 决 于 干 
扰 流 量 。 特 别 是 ， 如 果 许 多 其 他 的 数据 流 也 通过 这 条 链 路 流动 ， 一 条 具有 高 传输 速率 的 链 
路 仍然 可 能 成 为 文件 传输 的 瓶颈 链 路 。 我 们 将 在 课 后 习题 中 和 后 继 章节 中 更 仔细 地 研究 计 
算 机 网 络 中 的 否 吐 量 。 


1.5 协议 层次 及 其 服务 模型 


从 我 们 到 目前 的 讨论 来 看 ， 因 特 网 显然 是 一 个 极为 复杂 的 系统 。 我 们 已 经 看 到 ， 因 特 
网 有 许多 部 分 : 大 量 的 应 用 程序 和 协议 、 各 种 类 型 的 端 系统 、 分 组 交换 机 以 及 各 种 类 型 的 
链 路 级 媒体 。 面 对 这 种 巨大 的 复杂 性 ， 存 在 着 组 织 网 络 体系 结构 的 希望 吗 ? 或 者 至 少 存在 
着 我 们 对 网 络 体系 结构 进行 讨论 的 硕 望 吗 ? 幸运 的 是 ， 对 这 两 个 问题 的 回答 都 是 肯定 的 。 


1.5.1 分 层 的 体系 结构 


在 试图 组 织 我 们 关于 因特网 体系 结构 的 想法 之 前 ， 先 看 一 个 人 类 社会 与 之 类 比 的 例 
子 。 实 际 上 ,在 日 常生 活 中 我 们 一 直 都 与 复杂 系统 打交道 。 想 象 一 下 有 人 请 你 描述 比如 航 
线 系统 的 情况 吧 。 你 怎样 用 一 个 结构 来 描述 这 样 一 个 复杂 的 系统 ? 该 系统 具有 票务 代理 、 
行李 检查 、 登 机 口 人 员 、 飞 行 员 、 飞 机 、 空 中 航行 控制 和 世界 范围 的 导航 系统 。 描 述 这 种 
系统 的 一 种 方式 是 ， 描 述 当 你 乘 某 个 航班 时 ， 你 〈 或 其 他 人 蔡 你 ) 要 采取 的 一 系列 动作 。 
你 要 购买 机 票 ， 托 运行 李 ， 去 登 机 口 ， 并 最 终 登 上 这 次 航班 。 该 飞机 起 飞 ， 飞 行 到 目的 
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地 。 当 飞机 着 陆 后 ， 你 从 登 机 口 离 机 并 认领 行李 。 如 果 这 次 行程 不 理想 ， 你 向 票务 机 构 投 
诉 这 次 航班 〈 你 的 努力 一 无 所 获 ) 。 图 1-21 显示 了 相关 情况 。 

我 们 已 经 能 从 这 里 看 出 与 计算 机 网 络 的 
某 些 类 似 : 航空 公司 把 你 从 源 送 到 目的 地 ; 
而 分 组 被 从 因特网 中 的 源 主机 送 到 目的 主 | 
机 。 但 这 不 是 我 们 寻求 的 完全 的 类 似 。 我 们 ”要 寺 OW! 
在 图 1-21 中 寻找 某 些 结构 。 观 察 图 1-21, 我 La 
们 注意 到 在 每 一 端 都 有 票务 功能 ; 还 对 已 经 
检票 的 乘客 有 托运 行李 功能 ， 对 已 经 检票 并 BA E 机) 
已 经 检查 过 行李 的 乘客 有 登 机 功能 。 对 于 那 w 
些 已 经 通过 登 机 口 的 乘客 ( 即 已 经 经 过 检 
票 、 行 李 检查 和 通过 登 机 口 的 乘客 ) ， 有 起 
飞 和 着 陆 的 功能 ， 并 且 在 飞行 中 ， 有 飞机 按 
预定 路 线 飞 行 的 功能 。 这 提示 我 们 能 够 以 水 
平 的 方式 看 待 这 些 功 能 ， 如 图 1-22 所 示 。 图 1-21 乘机 旅行 的 一 系列 动作 

图 1-22 将 航线 功能 划分 为 一 些 层次 ， 提 供 了 我 们 能 够 讨论 航线 旅行 的 框架 。 注 意 到 
每 个 层次 与 其 下 面 的 层次 结合 在 一 起 ， 实 现 了 某 些 功能 、 服 务 。 在 票务 层 及 以 下 ， 完 成 了 
一 个 人 从 航线 柜台 到 航线 柜台 的 转移 。 在 行李 层 及 以 下 ， 完 成 了 人 和 行李 从 行李 托运 到 行 
李 认 领 的 转移 。 注 意 到 行李 层 仅 对 已 经 完成 票务 的 人 提供 服务 。 在 登 机 口 层 ， 完 成 了 人 和 
行李 从 离 港 登 机 口 到 到 港 登 机 口 的 转移 。 在 起 飞 /着 陆 层 ， 完 成 了 一 个 人 和 手提 行李 从 跑 
道 到 跑道 的 转移 。 每 个 层次 通过 以 下 方式 提供 服务 : @ 在 这 层 中 执行 了 某 些 动作 〈 例 如 ， 
在 登 机 口 层 ， 某 飞机 的 乘客 登 机 和 离 机) ;@@ 使 用 直接 下 层 的 服务 〈 例 如 ， 在 登 机 口 层 ， 
使 用 起 飞 /着 陆 层 的 跑道 到 跑道 的 旅客 转移 服务 ) 。 
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|| 按 路 线 飞行 ”| | 按 路 线 飞行 。 
离开 机 场 中 间 空 中 交通 控制 中 心 
图 1-22 航线 功能 的 水 平分 层 


利用 分 层 的 体系 结构 ， 我 们 可 以 讨论 一 个 大 而 复杂 系统 的 定义 良好 的 特定 部 分 。 这 种 
简化 本 身 由 于 提供 模块 化 而 具有 很 高 价值 ， 这 使 菜 层 所 提供 的 服务 实现 易于 改变 。 只 要 该 
层 对 其 上 面 的 层 提供 相同 的 服务 ， 并 且 使 用 来 目下 面 层次 的 相同 服务 ， 当 茶 层 的 实现 变化 
时 ， 该 系统 的 其 余部 分 保持 不 变 。( 注 意 到 改变 一 个 服务 的 实现 与 改变 服务 本 身 是 极为 不 
同 的 !) 例如 ， 如 果 登 机 口 功能 被 改变 了 (例如 让 人 们 按 身 高 登 机 和 离 机 )， 航 线 系统 的 
其 余部 分 将 保持 不 变 ， 因 为 登 机 口 仍然 提供 相同 的 功能 (人们 登 机 和 离 机 ); 改变 后 ， 它 
仅 是 以 不 同 的 方式 实现 了 该 功能 。 对 于 大 而 复杂 且 需 要 不 断 更 新 的 系统 ， 改 变 服务 的 实现 
而 不 影响 该 系统 其 他 组 件 是 分 层 的 男 一 个 重要 优点 。 
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1. 协议 分 层 

我 们 对 航线 已 经 进行 了 充分 讨论 ， 现 将 注意 力 转 回 网 络 协 议 。 为 了 给 网 络 协 议 的 设计 
提供 一 个 结构 ， 网 络 设计 者 以 分 层 (layer) 的 方式 组 织 协议 以 及 实现 这 些 协 议 的 网 络 硬件 
和 软件 。 每 个 协议 属于 这 些 层次 之 一 ， 就 像 图 1-22 所 示 的 航线 体系 结构 中 的 每 种 功能 属 
于 某 一 层 一 样 。 我 们 再 次 关注 某 层 向 它 的 上 一 层 提供 的 服务 (service), ， 即 所 谓 一 层 的 服 
务 模型 (service model) 。 就 像 前 面 航线 例子 中 的 情况 一 样 ， 每 层 通过 在 该 层 中 执行 某 些 动 
作 或 使 用 直接 下 层 的 服务 来 提供 服务 。 例 如 ， 由 第 n 层 提供 的 服务 可 能 包括 报 文 从 网 络 的 
一 边 到 男 一 边 的 可 靠 交 付 。 这 可 能 是 通过 使 用 第 -1 层 的 边缘 到 边缘 的 不 可 靠 报 文 传送 
服务 ， 加 上 第 n 层 的 检测 和 重 传 丢失 报 文 的 功能 来 实现 的 。 

一 个 协议 层 能 够 用 软件 、 硬 件 或 两 者 的 结合 来 实现 。 诸 如 HTTP 和 SMTP 这 样 的 应 用 

层 协 议 几 乎 总 是 在 端 系统 中 用 软件 实现 ， 运 输 层 协议 也 是 如 此 。 因 为 物理 层 和 数据 链 路 层 
负责 处 理 跨越 特定 链 路 的 通信 ， 它 们 通常 在 与 给 定 链 路 相关 联 的 网 络 接口 卡 〈 例 如 以 太 网 
或 WiFi 接口 卡 ) 中 实现 。 网 络 层 经 常 是 硬件 和 软件 实现 的 混合 体 。 还 要 注意 的 是 ， 如 同 
分 层 的 航线 体系 结构 中 的 功能 分 布 在 构成 该 系统 的 各 机 场 和 飞行 控制 中 心中 一 样 ， 一 个 第 
n 层 协议 也 分 布 在 构成 该 网 络 的 端 系统 、 分 组 交换 机 和 其 他 组 件 中 。 这 就 是 说 ， 第 n 层 协 
议 的 不 同 部 分 常常 位 于 这 些 网 络 组 件 的 各 部 分 中 。 

协议 分 层 具 有 概念 化 和 结构 化 的 优点 [RFC 3439 ] 。 如 我 们 看 到 的 那样 ， 分 层 提 供 了 
一 种 结构 化 方式 来 讨论 系统 组 件 。 模 块 化 使 更 新 系统 组 件 更 为 容易 。 然 而 ， 需 要 提 及 的 
是 ， 某 些 研究 人 员 和 联网 工程 师 激烈 地 反对 分 层 [Wakeman 1992 ] 。 分 层 的 一 个 潜在 缺点 
是 一 层 可 能 宛 余 较 低层 的 功能 。 例 如 ， 许 多 协议 栈 在 基于 每 段 链 路 和 基于 端 到 端 两 种 情况 
下 ， 都 提供 了 差错 恢复 。 第 二 种 潜在 的 缺点 是 某 层 的 功能 可 能 需要 仅 在 其 他 某 层 才 出 现 的 
信息 (QUA), ， 这 违反 了 层次 分 离 的 目标 。 

将 这 些 综合 起 来 ， 各 层 的 所 有 协议 被 称 为 协议 栈 (protocol stack ) 。 因 特 网 的 协议 栈 由 
5 个 层次 组 成 : 物理 层 、 链 路 层 、 网 络 层 、 运 输 层 和 应 用 层 〈 如 图 1-23a 所 示 ) 。 如 果 你 查 
看 本 书目 录 ， 将 会 发 现 我 们 大 致 是 以 因特网 协议 栈 的 层次 来 组 织 本 书 的 。 我 们 采用 了 自 项 
向 下 方法 (top-down approach) ， 首 先 处 理应 用 层 ， 然 后 向 下 进行 处 理 。 

(1) 应 用 层 

应 用 层 是 网 络 应 用 程序 及 它们 的 应 用 层 协 
议 存 留 的 地 方 。 因 特 网 的 应 用 层 包括 许多 协 
i, Hin HTTP (ERE ST Web 文档 的 请 求 和 
传送 ) SMTP ( 它 提供 了 电子 邮件 报 文 的 传 
输 ) 和 FTP ( 它 提供 两 个 端 系 统 之 间 的 文件 传 
送 )。 我 们 将 看 到 ， 某 些 网 络 功 能 ， 如 将 像 
www. ietf. org 这 样 对 人 友好 的 端 系统 名 字 转 换 
为 32 比特 的 网 络 地 址 ， 也 是 借助 于 特定 的 应 
用 层 协议 即 域名 系统 (DNS) HRR, RAK V 5 层 因 特 网 协议 栈 b) 7 层 ISO OSI 参考 模型 
在 第 2 章 中 看 到 ， 创 建 并 部 署 我 们 自己 的 新 应 图 1-23 ”因特网 协议 栈 和 OSI 参考 模型 
用 层 协议 是 非常 容易 的 。 

应 用 层 协议 分 布 在 多 个 端 系统 上 ， 而 一 个 端 系统 中 的 应 用 程序 使 用 协议 与 另 一 个 端 系统 
中 的 应 用 程序 交换 信息 分 组 。 我 们 把 这 种 位 于 应 用 层 的 信息 分 组 称 为 报 文 (message ) 。 
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(2) 运输 层 

因特网 的 运输 层 在 应 用 程序 端点 之 间 传 送 应 用 层 报 文 。 在 因特网 中 ， 有 两 种 运输 协 
iM, BU TCP 和 UDP， 利 用 其 中 的 任 一 个 都 能 运输 应 用 层 报 文 。TCP 向 它 的 应 用 程序 提供 了 
面向 连接 的 服务 。 这 种 服务 包括 了 应 用 层 报 文 向 目的 地 的 确保 传递 和 流量 控制 〈 即 发 送 
方 /接收 方 速率 匹配 ) 。TCP 也 将 长 报 文 划 分 为 短 报 文 ， 并 提供 拥塞 控制 机 制 ， 因 此 当 网 络 
拥塞 时 ， 源 抑制 其 传输 速率 。UDP 协议 向 它 的 应 用 程序 提供 无 连接 服务 。 这 是 一 种 不 提供 
不 必要 服务 的 服务 ,没有 可 靠 性 ， 没 有 流量 控制 ， 也 没有 拥塞 控制 。 在 本 书 中 ， 我们 把 运 
输 层 的 分 组 称 为 报 文 段 (segment) 。 

(3) 网 络 层 

因特网 的 网 络 层 负责 将 称 为 数据 报 (datagram) 的 网 络 层 分 组 从 一 台 主 机 移动 到 男 一 
台 主 机 。 在 一 台 源 主机 中 的 因特网 运输 层 协 议 (TCP ak UDP) 向 网 络 层 递交 运输 层 报 文 段 
和 目的 地 址 ， 就 像 你 通过 邮政 服务 寄 信件 时 提供 一 个 目的 地 址 一 样 。 

因特网 的 网 络 层 包括 著名 的 网 际 协议 下， 该 协议 定义 了 在 数据 报 中 的 各 个 字段 以 及 端 
系统 和 路 由 器 如 何 作用 于 这 些 字 段 。IP 仅 有 一 个 ， 所 有 具有 网 络 层 的 因特网 组 件 必 须 运 行 
了。 因特网 的 网 络 层 也 包括 决定 路 由 的 路 由 选择 协议 ， 它 根据 该 路 由 将 数据 报 从 源 传输 到 
目的 地 。 因 特 网 具有 许多 路 由 选择 协议 。 如 我 们 在 1.3 节 所 见 ， 因 特 网 是 一 个 网 络 的 网 
络 ， 并 且 在 一 个 网 络 中 ， 其 网 络 管理 者 能 够 运行 所 希望 的 任何 路 由 选择 协议 。 尽 管 网 络 层 
包括 了 网 际 协 议和 一 些 路 由 选择 协议 ,但 通常 把 它 简单 地 称 为 IP 层 ， 这 反映 了 P 是 将 因 
特 网 连接 在 一 起 的 黏合 剂 这 样 的 事实 。 

(4) 链 路 层 

因特网 的 网 络 层 通过 源 和 目的 地 之 间 的 一 系列 路 由 器 路 由 数据 报 。 为 了 将 分 组 从 一 个 
节点 〈 主 机 或 路 由 器 ) 移动 到 路 径 上 的 下 一 个 节点 ， 网 络 层 必须 依靠 该 链 路 层 的 服务 。 特 
别 是 在 每 个 节点 ， 网 络 层 将 数据 报 下 传 给 链 路 层 ， 链 路 层 沿 着 路 径 将 数据 报 传递 给 下 一 个 
- 节点 。 在 该 下 一 个 节点 ， 链 路 层 将 数据 报 上 传 给 网 络 层 。 

由 链 路 层 提供 的 服务 取决 于 应 用 于 该 链 路 的 特定 链 路 层 协议 。 例 如 ， 某 些 协议 基于 链 
路 提供 可 靠 传 递 ， 从 传输 节点 跨越 一 条 链 路 到 接收 节点 。 值 得 注意 的 是 ， 这 种 可 靠 的 传递 
服务 不 同 于 TCP 的 可 靠 传递 服务 ，TCP 提供 从 一 个 端 系统 到 另 一 个 端 系统 的 可 靠 交 付 。 链 
路 层 的 例子 包括 以 太 网 、WiFi 和 电缆 接 人 网 的 DOCSIS 协议 。 因 为 数据 报 从 源 到 目的 地 传 
送 通常 需要 经 过 几 条 链 路 ， 一 个 数据 报 可 能 被 沿途 不 同 链 路 上 的 不 同 链 路 层 协议 处 理 。 例 
如 ， 一 个 数据 报 可 能 被 一 段 链 路 上 的 以 太 网 和 下 一 段 链 路 上 的 PPP 所 处 理 。 网 络 层 将 受到 
来 自 每 个 不 同 的 链 路 层 协 议 的 不 同 服 务 。 在 本 书 中 ， 我 们 把 链 路 层 分 组 称 为 帧 (frame) 。 

(5) 物理 层 

虽然 链 路 层 的 任务 是 将 整个 帧 从 一 个 网 络 元 素 移 动 到 邻近 的 网 络 元 素 ， 而 物理 层 的 任务 
是 将 该 帧 中 的 一 个 个 比特 从 一 个 节点 移动 到 下 一 个 节点 。 在 这 层 中 的 协议 仍然 是 链 路 相关 
的 ， 并且 进一步 与 该 链 路 (例如 ， 双 绞 铜 线 、 单 模 光 纤 ) 的 实际 传输 媒体 相关 。 人 例如， 以太 
网 具有 许多 物理 层 协议 : 一 个 是 关于 双 绞 铜 线 的 ， 另 一 个 是 关于 同 轴 电缆 的 ， 还 有 一 个 是 关 
于 光纤 的 ， 等 等 。 在 每 种 场合 中 ， 跨 越 这 些 链 路 移动 一 个 比特 是 以 不 同 的 方式 进行 的 。 

2. OSI 模型 

详细 地 讨论 过 因特网 协议 栈 后 ， 我 们 应 当 提 及 它 不 是 唯一 的 协议 栈 。 特 别 是 在 20 tH 
纪 70 年 代 后 期 ， 国 际 标准 化 组 织 (ISO) 提出 计算 机 网 络 围绕 7 层 来 组 织 ， 称 为 开放 系统 


互 连 (OSI) 模型 [ISO 2016 ] 。 当 那些 要 成 为 因特网 协议 的 协议 还 处 于 褪 宰 之 中 ， 只 是 许 
多 正在 研发 的 不 同 协议 族 之 一 时 ，0SI 模型 就 已 经 成 形 。 事 实 上 ， 初 始 OSI 模型 的 发 明 者 
在 创建 该 模型 时 心中 可 能 并 没有 想到 因特网 。 无 论 如 何 ， 自 20 世纪 70 年 代 后 期 开始 ， 许 
多 培训 课程 和 大 学 课程 都 围绕 7 层 模 型 挑选 有 关 ISO 授权 和 组 织 的 课程 。 因 为 它 在 网 络 教 
育 的 早期 影响 ,该 7 层 模 型 继续 以 某 种 方式 存留 在 某 些 网 络 教科 书 和 培训 诬 程 中 。 

显示 在 图 1-23b 中 的 OS 参考 模型 的 7 层 是 : 应 用 层 、 表 示 层 、 会 话 层 、 运 输 层 、 网 
络 层 、 数 据 链 路 层 和 物理 层 。 这 些 层次 中 ，5 层 的 功能 大 致 与 它们 名 字 类 似 的 因特网 对 应 
层 的 功能 相同 。 所 以 ， 我 们 来 考虑 O 参考 模型 中 附加 的 两 个 层 ， 即 表示 层 和 会 话 层 。 表 
示 层 的 作用 是 使 通信 的 应 用 程序 能 够 解释 交换 数据 的 含义 。 这 些 服 务 包 括 数 据 压缩 和 数据 
加 密 (它们 是 自 解 释 的 ) 以 及 数据 描述 (这 使 得 应 用 程序 不 必 担 心 在 各 台 计 算 机 中 表示 / 
存储 的 内 部 格式 不 同 的 问题 ) 。 会 话 层 提供 了 数据 交换 的 定 界 和 同步 功能 ， 包 括 了 建立 检 
查 点 和 恢复 方案 的 方法 。 

因特网 缺少 了 在 0SI 参考 模型 中 建立 的 两 个 层次 ， 该 事实 引起 了 一 些 有 趣 的 问题 : 
这 些 层 次 提供 的 服务 不 重要 吗 ? 如 果 一 个 应 用 程序 需要 这 些 服务 之 一 ， 将 会 怎样 呢 ? A 
特 网 对 这 两 个 问题 的 回答 是 相同 的 : 这 留 给 应 用 程序 开发 者 处 理 。 应 用 程序 开发 者 决定 
一 个 服务 是 否 是 重要 的 ， 如 果 该 服务 重要 ， 应 用 程序 开发 者 就 应 该 在 应 用 程序 中 构建 该 
功能 。 


1.5.2 封装 


图 1-24 显示 了 这 样 一 条 物理 路 径 : 数据 从 发 送 端 系统 的 协议 栈 向 下 ， 沿 着 中 间 的 链 
路 层 交 换 机 和 路 由 器 的 协议 栈 上 上 下 下 ， 然 后 向 上 到 达 接 收 端 系统 的 协议 栈 。 如 我 们 将 在 
本 书后 面 讨论 的 那样 ， 路 由 器 和 链 路 层 交 换 机 都 是 分 组 交换 机 。 与 端 系统 类 似 ， 路 由 项 和 
链 路 层 交 换 机 以 多 层次 的 方式 组 织 它们 的 网 络 硬件 和 软件 。 而 路 由 器 和 链 路 层 交 换 机 并 不 
实现 协议 栈 中 的 所 有 层次 。 如 图 1-24 所 示 ， 链 路 层 交 换 机 实现 了 第 一 层 和 第 二 层 ; 路 由 
器 实现 了 第 一 层 到 第 三 层 。 例 如 ， 这 意味 着 因特网 路 由 器 能 够 实现 卫 协议 〈 一 种 第 三 层 
协议 ) ， 而 链 路 层 交 换 机 则 不 能 。 我 们 将 在 后 面 看 到 ， 尽 管 链 路 层 交 换 机 不 能 识别 IP 地 
址 ， 但 它们 能 够 识别 第 二 层 地 址 ， 如 以 太 网 地 址 。 值 得 注意 的 是 ， 主 机 实现 了 所 有 5 个 层 
次 ， 这 与 因特网 体系 结构 将 它 的 复杂 性 放 在 网 络 边缘 的 观点 是 一 致 的 。 

图 1-24 也 说 明了 一 个 重要 概念 : 封装 (encapsulation)。 在 发 送 主 机 端 ， 一 个 应 用 层 
报 文 (application-layer message) (图 1-24 中 的 M) 被 传送 给 运输 层 。 在 最 简单 的 情况 下 ， 
运输 层 收取 到 报 文 并 附 上 附加 信息 ( 所谓 运 输 层 首部 信息 ， 图 1-24 中 的 H,)， 该 首部 将 被 
接收 端的 运输 层 使 用 。 应 用 层 报 文 和 运输 层 首部 信息 一 道 构成 了 运输 层 报 文 段 (transport- 
layer segment) 。 运 输 层 报 文 段 因此 封装 了 应 用 层 报 文 。 附 加 的 信息 也 许 包 括 了 下 列 信 息 : 
人 允许 接收 端 运输 层 向 上 向 适当 的 应 用 程序 交付 报 文 的 信息 ; 差错 检测 位 信息 ， 该 信息 让 接 
收 方 能 够 判断 报 文中 的 比特 是 否 在 途中 已 被 改变 。 运 输 层 则 向 网 络 层 传递 该 报 文 段 ， 网 络 
层 增 加 了 如 源 和 目的 端 系 统 地 址 等 网 络 层 首部 信息 (图 1-24 中 的 H,)， 生 成 了 网 络 层 数 
据 报 (network-layer datagram) 。 该 数据 报 接 下 来 被 传递 给 链 路 层 ， 链 路 层 ( 自然而然 地 ) 
增加 它 自己 的 链 路 层 首 部 信息 并 生成 链 路 层 帧 (link-layer frame)。 所 以 我 们 看 到 ， 在 每 一 
层 ， 一 个 分 组 具有 两 种 类 型 的 字段 : 首部 字段 和 有 效 载荷 字段 (payload field), ARB 
通常 是 来 自 上 一 层 的 分 组 。 
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Hx M 

报 文 段 HIM 
eR Hy, Hy M 
wi 了 H, Hy M 





图 1-24 主机 、 路 由 器 和 链 路 层 交 换 机 ， 每 个 包含 了 不 同 的 层 ， 反 映 了 它们 的 功能 差异 


这 里 一 个 有 用 的 类 比 是 经 过 公共 邮政 服务 在 某 公 司 办 事 处 之 间 发 送 一 封 备忘录 。 假 定 
位 于 某 办 事 处 的 Alice 要 向 位 于 另 一 办 事 处 的 Bob 发 送 一 封 备忘录 。 该 备忘录 类 比 于 应 用 
EARL, Alice 将 备忘录 放 人 办 事 处 之 间 的 公函 信封 中 ， 并 在 公函 信封 上 方 写 上 了 Bob 的 
名 字 和 部 门 。 该 办 事 处 之 间 的 公函 信封 类 比 于 运输 层 报 文 段 ， 即 它 包 括 了 首部 信息 (Bob 
的 名 字 和 部 门 编号 ) 并 封装 了 应 用 层 报 文 (备忘录 ) 。 当 发 送 办 事 处 的 收发 室 拿 到 该 办 事 
处 之 间 的 备忘录 时 ， 将 其 放 和 人 适合 在 公共 邮政 服务 发 送 的 信封 中 ， 并 在 邮政 信封 上 写 上 发 
送 和 接收 办 事 处 的 邮政 地 址 。 此 处 ， 邮 政信 封 类 比 于 数据 报 ， 它 封装 了 运输 层 的 报 文 段 
(办 事 处 之 间 的 公函 信封 ) ， 该 报 文 段 封装 了 初始 报 文 (备忘录 ) 。 邮 政 服务 将 该 邮政 信封 
交付 给 接收 办 事 处 的 收发 室 。 在 此 处 开始 了 拆 封 过 程 。 该 收发 室 取 出 了 办 事 处 之 间 的 公 响 
信封 并 转发 给 Bob。 最 后 ，Bob 打开 信封 并 拿 走 了 备忘录 。 

封装 的 过 程 能 够 比 前 面 描述 的 更 为 复杂 。 例 如 ， 一 个 大 报 文 可 能 被 划分 为 多 个 运输 层 
的 报 文 段 (这 些 报 文 段 每 个 可 能 被 划分 为 多 个 网 络 层 数据 报 ) 。 在 接收 端 ， 则 必须 从 其 连 
续 的 数据 报 中 重 构 这 样 一 个 报 文 段 。 


1.6 面 对 攻 击 的 网 络 


对 于 今天 的 许多 机 构 (包括 大 大 小 小 的 公司 、 大 学 和 政府 机 关 ) 而 言 ， 因 特 网 已 经 成 为 
与 其 使 命 密切 相关 的 一 部 分 了 。 许 多 人 也 依赖 因特网 从 事 各 种 职业 、 社 会 和 个 人 活动 。 目 
前 ， 数 以 亿 计 的 物品 (包括 可 穿戴 设备 和 家 用 设备 ) 与 因特网 相连 。 但 是 在 所 有 这 一 切 背 
后 ,存在 着 一 个 阴暗 面 ， 其 中 的 “ 坏 家 伙 ” 试 图 对 我 们 的 日 常生 活 进行 破坏 ， 如 损坏 我 们 与 
因特网 相连 的 计算 机 ， 侵 犯 我 们 的 隐私 以 及 使 我 们 依赖 的 因特网 服务 无 法 运行 。 


网 络 安全 领域 主要 探讨 以 下 问题 : 坏 家 伙 如 何 攻击 计算 机 网 络 ， 以 及 我 们 ( 即将 成 为 
计算 机 网 络 的 专家 ) 如 何 防御 以 免 受 他 们 的 攻击 ， 或 者 更 好 的 是 设计 能 够 事先 免除 这 样 的 
攻击 的 新 型 体系 结构 。 面 对 经 常 发 生 的 各 种 各 样 的 现 有 攻击 以 及 新 型 和 更 具 摧 毁 性 的 未 来 
攻击 的 威胁 ， 网 络 安全 已 经 成 为 近年 来 计算 机 网 络 领域 的 中 心 主题 。 本 书 的 特色 之 一 是 将 
网 络 安全 问题 放 在 中 心 位 置 。 

因为 我 们 在 计算 机 网 络 和 因特网 协议 方面 还 没有 专业 知识 ， 所 以 这 里 我 们 将 从 审视 某 
些 今天 最 为 流行 的 与 安全 性 相关 的 问题 开始 。 这 将 刺激 我 们 的 胃口 ， 以 便 我 们 在 后 续 章 节 
中 进行 更 为 充实 的 讨论 。 我 们 在 这 里 以 提出 问题 开始 : 什么 会 出 现 问题 ? 计算 机 网 络 是 如 
何 受 到 攻击 的 ? 今天 一 些 最 为 流行 的 攻击 类 型 是 什么 ? 

1， 坏 家 伙 能 够 经 因特网 将 有 害 程 序 放 人 你 的 计算 机 中 

因为 我 们 要 从 /向 因特网 接收 /发 送 数据 ， 所 以 我 们 将 设备 与 因特网 相连 。 这 包括 各 种 
好 东西 ， 例 如 Instagram 帖子 、 因 特 网 搜索 结果 、 流 式 音乐 、 视 频 会 议 、 流 式 电影 等 。 但 
不 幸 的 是 ， 伴 随 好 的 东西 而 来 的 还 有 恶意 的 东西 ， 这 些 恶意 的 东西 可 统称 为 恶意 软件 
(malware) ， 它 们 能 够 进入 并 感染 我 们 的 设备 。 一 旦 恶意 软件 感染 我 们 的 设备 ， 就 能 够 做 
各 种 不 正当 的 事情 ， 包 括 删 除 我 们 的 文件 ， 安 装 间谍 软件 来 收集 我 们 的 隐私 信息 ， 如 社会 
保险 号 、 口 令 和 击 键 ， 然 后 将 这 些 (当然 经 因特网 ) 发 送 给 坏 家 伙 。 我 们 的 受害 主机 也 可 
能 成 为 数 以 千 计 的 类 似 受害 设备 网 络 中 的 一 员 ， 它 们 被 统称 为 僵尸 网 络 (botnet), HARK 
利用 僵尸 网 络 控制 并 有 效 地 对 目标 主机 展开 垃圾 邮件 分 发 或 分 布 式 拒 绝 服务 攻击 (很 快 将 
讨论 ) 。 

至 今 为 止 的 多 数 恶 意 软件 是 自我 复制 (self- replicating) 的 : 一 旦 它 感染 了 一 台 主 机 ， 
就 会 从 那 台 主机 寻求 进入 因特网 上 的 其 他 主机 ， 从 而 形成 新 的 感染 主机 ， 再 寻求 进入 更 多 
的 主机 。 以 这 种 方式 ， 自 我 复制 的 恶意 软件 能 够 指数 式 地 快速 扩散 。 恶 意 软件 能 够 以 病毒 
或 蠕虫 的 形式 扩散 。 病 毒 (virus) 是 一 种 需要 某 种 形式 的 用 户 交 互 来 感染 用 户 设备 的 恶意 
软件 。 典 型 的 例子 是 包含 恶意 可 执行 代码 的 电子 邮件 附件 。 如 果 用 户 接收 并 打开 这 样 的 附 
件 ， 不 经 意 间 就 在 其 设备 上 运行 了 该 恶意 软件 。 通 常 ， 这 种 电子 邮件 病毒 是 自我 复制 的 : 
例如 ， 一旦 执行 ， 该 病毒 可 能 向 用 户 地 址 矫 上 的 每 个 接收 方 发 送 一 个 具有 相同 恶意 附件 的 
相同 报 文 。 蠕 虫 (worm) 是 一 种 无 须 任 何 明显 用 户 交 互 就 能 进入 设备 的 恶意 软件 。 例 如 ， 
用 户 也 许 运行 了 一 个 攻击 者 能 够 发 送 恶 意 软件 的 脆弱 网 络 应 用 程序 。 在 某 些 情况 下 ,没有 
用 户 的 任何 干预 ， 该 应 用 程序 可 能 从 因特网 接收 恶意 软件 并 运行 它 ， 生 成 了 蠕虫 。 新 近 感 
染 设备 中 的 蠕虫 则 能 扫描 因特网 ， 搜 索 其 他 运行 相同 网 络 应 用 程序 的 易 受 感染 的 主机 。 当 
它 发 现 其 他 易 受 感染 的 主机 时 ， 便 向 这 些 主机 发 送 一 个 它 自 身 的 副本 。 今天， 恶意 软件 无 
所 不 在 且 防 范 成 本 高 。 当 你 用 这 本 书 学 习 时 ， 我们 鼓励 你 思考 下 列 问题 ， 计算 机 网 络 设计 
者 能 够 采取 什么 防御 措施 ， 以 使 与 因特网 连接 的 设备 免 受 恶意 软件 的 攻击 ? 

2. 坏 家 伙 能 够 攻击 服务 器 和 网 络 基 础 设施 

另 一 种 宽泛 类 型 的 安全 性 威胁 称 为 拒绝 服务 攻击 (Denial- of- Service (DoS) attack) 。 
顾名思义 ，DoS 攻击 使 得 网 络 、 主 机 或 其 他 基础 设施 部 分 不 能 由 合法 用 户 使 用 。Web 服务 
ar, FLARE AR SS at. DNS 服务 器 (在 第 2 章 中 讨论 ) 和 机 构 网 络 都 能 够 成 为 DoS 攻击 
的 目标 。 因 特 网 DoS 攻击 极为 常见 ， 每 年 会 出 现 数 以 千 计 的 DoS 攻击 [Moore 2001] 。 访 
问 数字 攻击 图 (Digital Attack Map) 站 点 可 以 观看 世界 范围 内 每 天 最 厉害 的 DoS 攻击 
[DAM 2016] 。 大 多 数 因特网 DoS 攻击 属于 下 列 三 种 类 型 之 一 ， 
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© 弱点 攻击 。 这 涉及 向 一 台 目 标 主机 上 运行 的 易 受 攻击 的 应 用 程序 或 操作 系统 发 送 
制作 精细 的 报 文 。 如 果 适 当 顺 序 的 多 个 分 组 发 送 给 一 个 易 受 攻击 的 应 用 程序 或 操 
作 系 统 ， 该 服务 器 可 能 停止 运行 ， 或 者 更 糟糕 的 是 主机 可 能 裔 溃 。 
。 带宽 洪 泛 。 攻 击 者 向 目标 主机 发 送 大 量 的 分 组 ， 分 组 数量 之 多 使 得 目标 的 接 人 链 
路 变 得 拥塞， 使 得 合法 的 分 组 无 法 到 达 服 务 顺 。 
© 连接 洪 泛 。 攻 击 者 在 目标 主机 中 创建 大 量 的 半 开 或 全 开 TCP 连接 〈 将 在 第 3 章 中 
讨论 TCP 连接 )。 该 主机 因 这 些 伪造 的 连接 而 陷入 困境 ， 并 停止 接受 合法 的 连接 。 
我 们 现在 更 详细 地 研究 这 种 市 宽 洪 泛 攻击 。 回 顾 1.4.2 节 中 讨论 的 时 延 和 丢 包 问 题 ， 
显然 ， 如 果 某 服务 器 的 接 入 速率 为 Rbps， 则 攻击 者 将 需要 以 大 约 R bps 的 速率 来 产生 危 
害 。 如 果 尺 非常 大 的 话 ， 单 一 攻击 源 可 能 无 法 产生 足够 大 的 流量 来 伤害 该 服务 器 。 此 外 ， 
如 果 从 单一 源 发 出 所 有 流量 的 话 ， 某 上 游 路 由 器 就 能 够 检测 出 该 攻击 并 在 该 流量 靠近 服务 
髓 之 前 就 将 其 阻挡 下 来 。 在 图 1-25 中 显示 的 分 布 式 DoS (Distributed DoS, DDoS) F, KH 
击 者 控制 多 个 源 并 让 每 个 源 向 目标 猛烈 发 送 流量 。 使 用 这 种 方法 ， 遍 及 所 有 受 控 源 的 聚合 
流量 速率 需要 大 约 尽 的 能 力 来 使 该 服务 陷 人 瘫痪 。DDosS 攻击 充分 利用 由 数 以 千 计 的 受害 
主机 组 成 的 僵尸 网 络 ， 这 在 今天 是 屡见不鲜 的 [DAM 2016]。 相 比 于 来 自 单一 主机 的 DoS 
Wit, DDoS 攻击 更 加 难以 检测 和 防范 。 





图 1-25 “分布 式 拒绝 服务 攻击 
当 学 习 这 本 书 时 ， 我 们 鼓励 你 考虑 下 列 问题 计算 机 网 络 设计 者 能 够 采取 哪些 措施 防 
IE DoS 攻击 ? 我 们 将 看 到 ， 对 于 3 种 不 同类 型 的 DoS 攻击 需要 采用 不 同 的 防御 方法 。 
3. 坏 家 伙 能 够 嗅 探 分 组 


今天 的 许多 用 户 经 无 线 设 备 接 人 因特网 ， 如 WiFi 连接 的 膝 上 计算 机 或 使 用 蜂窝 因 特 
网 连接 的 手持 设备 〈 在 第 7 章 中 讨论 ) 。 无 所 不 在 的 因特网 接 人 极为 便利 并 让 移动 用 户 方 
便 地 使 用 令 人 惊奇 的 新 应 用 程序 的 同时 ， 也 产生 了 严重 的 安全 脆弱 性 一 一 在 无 线 传输 设备 
的 附近 放置 一 台 被 动 的 接收 机 ， 该 接收 机 就 能 得 到 传输 的 每 个 分 组 的 副本 ! 这 些 分 组 包含 
了 各 种 敏感 信息 ， 包 括 口令 、 社 会 保险 号 、 商 业 秘密 和 隐秘 的 个 人 信息 。 记 录 每 个 流 经 的 
分 组 副本 的 被 动 接收 机 被 称 为 分 组 嗅 探 器 (packet sniffer) 。 

嗅 探 器 也 能 够 部 署 在 有 线 环境 中 。 在 有 线 的 广播 环境 中 ， 如 在 许多 以 太 网 LAN 中 ， 
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分 组 嗅 探 器 能 够 获得 经 该 LAN 发 送 的 所 有 分 组 。 如 在 1. 2 节 中 描述 的 那样 ， 电 缆 接 人 技 
术 也 广播 分 组 ， 因 此 易于 受到 嗅 探 攻击 。 此 外 ， 获 得 某 机 构 与 因特网 连接 的 接 人 路 由 需 或 
接 和 人 链 路 访问 权 的 坏 家 伙 能 够 放置 一 台 嗅 探 器 以 产生 从 该 机 构 出 人 的 每 个 分 组 的 副本 ， 抽 
对 嗅 探 到 的 分 组 进行 离线 分 析 ， 就 能 得 出 敏感 信息 。 

分 组 嗅 探 软件 在 各 种 Web 站 点 上 可 免费 得 到 ， 这 类 软件 也 有 商用 的 产品 。 教 网 络 课 
程 的 教授 布置 的 实验 作业 就 涉及 写 一 个 分 组 嗅 探 器 和 应 用 层 数 据 重 构 程 序 。 与 本 书 相 关联 
的 Wireshark [ Wireshark 2016] 实验 (参见 本 章 结 尾 处 的 Wireshark 实验 介绍 ) 使 用 的 正 
是 这 样 一 种 分 组 嗅 探 需 ! 

因为 分 组 嗅 探 器 是 被 动 的 ， 也 就 是 说 它们 不 向 信道 中 注入 分 组 ， 所 以 难以 检测 到 它 
们 。 因 此 ， 当 我 们 向 无 线 信道 发 送 分 组 时 ， 我 们 必须 接受 这 样 的 可 能 性 ， 即 某 些 坏 家 伙 可 
能 记录 了 我 们 的 分 组 的 副本 。 如 你 已 经 猜想 的 那样 ， 最 好 的 防御 嗅 探 的 方法 基本 上 都 与 密 
码 学 有 关 。 我 们 将 在 第 8 章 研 究 密码 学 应 用 于 网 络 安全 的 有 关内 容 。 

4， 坏 家 伙 能 够 伪装 成 你 信任 的 人 


生成 具有 任意 源 地 址 、 分 组 内 容 和 目的 地 址 的 分 组 ， 然 后 将 这 个 人 工 制作 的 分 组 传输 
到 因特网 中 ， 因 特 网 将 忠实 地 将 该 分 组 转发 到 目的 地 ， 这 一 切 都 极为 容易 ( 当 你 学 完 这 本 
教科 书后 ， 你 将 很 快 具 有 这 方面 的 知识 了 !) 。 想 象 某 个 接收 到 这 样 一 个 分 组 的 不 会 猜疑 的 
接收 方 〈 比 如 说 一 台 因 特 网 路 由 融 ) ， 将 该 〈 虚 假 的 ) 源 地 址 作为 真实 的 ， 进 而 执行 菜 些 
舱 入 在 该 分 组 内 容 中 的 命令 ( 比如 说 修改 它 的 转发 表 )。 将 具有 虚假 源 地 址 的 分 组 注入 因 
特 网 的 能 力 被 称 为 IP 哄骗 (IP spoofing) ， 而 它 只 是 一 个 用 户 能 够 冒充 为 一 个 用 户 的 许多 
方式 中 的 一 种 。 

为 了 解决 这 个 问题 ， 我 们 需要 采用 端点 鉴别 ， 即 一 种 使 我 们 能 够 确信 一 个 报 文 源 自 我 
们 认为 它 应 当 来 自 的 地 方 的 机 制 。 当 你 继续 学 习 本 书 各 章 时 ， 再 次 建议 你 思考 怎样 为 网 络 
应 用 程序 和 协议 做 这 件 事 。 我 们 将 在 第 8 章 探讨 端点 鉴别 机 制 。 

在 本 节 结 束 时 ,值得 思考 一 下 因特网 是 如 何 从 一 开始 就 落 入 这 样 一 种 不 安全 的 境地 
A, KREG, BRE: 因特网 最 初 就 是 基于 “一 群 相互 信任 的 用 户 连接 到 一 个 透明 的 网 
络 上 ”这 样 的 模型 [Blumenthal 2001] 进行 设计 的 ， 在 这 样 的 模型 中 ， 安 全 性 是 没有 必要 
的 。 初 始 的 因特网 体系 结构 在 许多 方面 都 深刻 地 反映 了 这 种 相互 信任 的 理念 。 例 如 ， 一 个 
用 户 向 任何 其 他 用 户 发 送 分 组 的 能 力 是 默认 的 ， 而 不 是 一 种 请 求 /准予 的 能 力 ， 还 有 用 户 
身份 取 自 所 宣称 的 表面 价值 ， 而 不 是 默认 地 需要 鉴别 。 

但 是 今天 的 因特网 无 疑 并 不 涉及 “相互 信任 的 用 户 ”。 但 是 , 今天 的 用 户 仍 然 需 要 通 
言 ， 当 他 们 不 必 相 互信 任 时 ， 他 们 也 许 硕 望 匿名 通信 ， 也 许 间 接地 通过 第 三 方 通信 (例如 
我 们 将 在 第 2 章 中 学 习 的 Web 高 速 缓存 ， 我 们 将 在 第 7 章 学 习 的 移动 性 协助 代理 ) ， 也 许 
不 信任 他 们 通信 时 使 用 的 硬件 、 软 件 甚 至 空气 。 随 着 我 们 进一步 学 习 本 书 ， 会 面临 许多 安 
全 性 相关 的 挑战 : 我 们 应 当 寻 求 对 嗅 探 、 端 点 假冒 、 中 间 人 攻击 、DDos 攻击 、 恶 意 软 件 
等 的 防护 办 法 。 我 们 应 当 记 住 : 在 相互 信任 的 用 户 之 间 的 通信 是 一 种 例外 而 不 是 规则 。 欢 
迎 你 到 现代 计算 机 网 络 世界 ! 


1.7 计算 机 网 络 和 因特网 的 历史 


1. 1 节 到 1. 6 节 概 述 了 计算 机 网 络 和 因特网 的 技术 。 你 现在 应 当 有 足够 的 知识 来 给 家 
人 和 朋友 留 下 深刻 印象 了 。 然 而 ， 如 果 你 真 的 想 在 下 次 鸡尾酒 会 上 一 鸣 惊 人 ， 你 应 当 在 你 
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AA Yee BER RRA RRAN AAE EEk [Segaller 1998] 。 
1.7.1 分 组 交换 的 发 展 : 1961 ~ 1972 


计算 机 网 络 和 今天 因特网 领域 的 开端 可 以 追溯 到 20 世纪 60 年 代 早 期 ， 那 时 电话 网 是 
世界 上 占 统治 地 位 的 通信 网 络 。1. 3 节 讲 过 ， 电 话 网 使 用 电路 交换 将 信息 从 发 送 方 传输 到 
接收 方 ， 这 种 适当 的 选择 使 得 语音 以 一 种 恒定 的 速率 在 发 送 方 和 接收 方 之 间 传 输 。 随 着 20 
世纪 60 年 代 早期 计算 机 的 重要 性 越 来 越 大 ， 以 及 分 时 计算 机 的 出 现 ， 考 虑 如 何 将 计算 机 
连接 在 一 起 ， 并 使 它们 能 够 被 地 理 上 分 布 的 用 户 所 共享 的 问题 ， 也 许 就 成 了 一 件 自 然 的 
事 。 这 些 用 户 所 产生 的 流量 很 可 能 具有 突 发 性 ， 即 活动 的 间断 性 ， 例 如 向 远程 计算 机 发 送 
一 个 命令 ， 接 着 是 静止 的 时 间 段 ， 这 是 等 待 应答 或 对 接收 到 的 响应 进行 思考 的 时 间 。 

全 世界 有 3 个 研究 组 首先 发 明了 分 组 交换 ， 以 作为 电路 交换 的 一 种 有 效 的 、 健 壮 的 替 
代 技 术 。 这 3 个 研究 组 互 不 知道 其 他 人 的 工作 [Leiner 1998], 。 有 关 分 组 交换 技术 的 首次 
公开 发 表 出 自 Leonard Kleinrock | Kleinrock 1961; Kleinrock 1964 | ， 那 时 他 是 麻 省 理工 学 
Be (MIT) 的 一 名 人 研究生 。Kleinrock 使 用 排队 论 ， 完 美 地 体现 了 使 用 分 组 交换 方法 处 理 突 
发 性 流量 源 的 有 效 性 。1964 年 ， 兰 德 公 司 的 Paul Baran [ Baran 1964] 已 经 开始 研究 分 组 
交换 的 应 用 ， 以 在 军用 网 络 上 传输 安全 语音 ， 同 时 在 英国 的 国家 物理 实验 室 (NPL), 
Donald Davies 和 Roger Scantlebury 也 在 研究 分 组 交换 技术 。 

MIT、 兰 德 和 NPL 的 工作 葛 定 了 今天 的 因特网 的 基础 。 但 是 因特网 也 经 历 了 很 长 的 
“ 边 构 建 边 示范 (let’ s-build-it-and- demonstrate-it)” 的 历史 ， 这 可 追 潮 到 20 世纪 60 年 代 
早期 ,J. C. R. Licklider | DEC 1990] 和 Lawrence Roberts 都 是 Kleinrock 在 MIT 的 同事 ， 他 
们 转 而 去 领导 美国 高 级 研究 计划 署 (Ad- ey 
vanced Research Projects Agency, ARPA) 的 Fa 
计算 机 科学 计划 。Roberts 公布 了 一 个 ARPA- TS i 
net [ Roberts 1967] 的 总 体 计 划 ， 它 是 第 一 | 
WAST AMA, BOKMAL Pn 
网 的 直接 祖先 。 在 1969 年 的 劳动 节 ， 第 一 台 
分 组 交换 机 在 Kleinrock WEE PF Bee FE SE HE 
加 州 大 学 洛杉矶 分 校 (UCLA), Hi3 台 分 
组 交换 机 不 久 后 安 疙 在 斯 坦 福 人 研究 所 ( Stan- 
ford Research Institute，SRI)、 美 国 加 州 大 学 
圣 巴 巴 拉 分 校 (UC Santa Barbara) 和 犹他 大 
学 (University of Utah) (参见 图 1-26), H 
BEE AY PB 7G Bl) 1969 年 年 底 有 了 4 个 
节点 。Kleinrock 回忆 说 ， 该 网 络 的 最 先 应 用 
是 从 UCLA 到 SRI 执行 远程 注册 ， 但 却 导 致 
了 该 系统 的 崩溃 [Kleinrock 2004 ] 。 

到 了 1972 年 ，ARPAnet 已 经 成 长 到 大 约 
15 个 节点 ， 由 Robert Kahn 首次 对 它 进 行 了 
公开 演示 。 在 ARPAnet 端 系统 之 间 的 第 一 台 = 
主机 到 主机 协议 一 一 称 为 网 络 控制 协议 图 1-26 一 台 早 期 的 分 组 交换 机 
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(NCP), ， 就 是 此 时 完成 的 [RFC 001] 。 随 着 端 到 端 协 议 的 可 供 使 用 ， 这 时 能 够 写 应 用 程 
序 了 。 在 1972 年 ，Ray Tomlinson 编写 了 第 一 个 电子 邮件 程序 。 


1.7.2 专用 网 络 和 网 络 互联 : 1972 ~1980 


最 初 的 ARPAnet 是 一 个 单一 的 、 封 闭 的 网 络 。 为 了 与 ARPAnet 的 一 台 主 机 通信 ， 一 
台 主 机 必须 与 男 一 台 ARPAnet IMP 实际 相连 。20 世纪 70 年 代 早 期 和 中 期 ， 除 ARPAnet 之 
外 的 其 他 分 组 交换 网 络 问 世 : ALOHAnet 是 一 个 微波 网 络 ， 它 将 夏威夷 岛 上 的 大 学 
| Abramson 1970] 以 及 DARPA 的 分 组 卫星 | RFC 829] 和 分 组 无 线 电 网 | Kahn 1987] 连 
接 到 一 起 ; Telenet 是 BBN 的 商用 分 组 交换 网 ， 它 基于 ARPAnet 技术 ; 由 Louis Pouzin 领衔 
的 Cyclades 是 法 国 的 一 个 分 组 交换 网 [Think 2012]; 还 有 如 Tymnet 和 GE 信息 服务 网 这 
样 的 分 时 网 络 ， 以 及 20 世纪 60 年 代 后 期 和 70 年 代 初 期 的 类 似 网 络 [ Schwartz 1977 | ; 
IBM 的 SNA (1996 ~1974) ， 它 与 ARPAnet 同时 在 运行 [Schwartz 1977 ] 。 

网 络 的 数目 开始 增加 。 人 们 事后 看 到 ， 研 制 将 网 络 连接 到 一 起 的 体系 结构 的 时 机 已 经 
成 熟 。 互 联网 络 的 先驱 性 工作 〈 得 到 了 美国 国防 部 高 级 研究 计划 署 (DARPA) 的 支持 ) 
由 Vinton Cerf 和 Robert Kahn [ Cerf 1974] 完成 ， 本 质 上 就 是 创建 一 个 网 络 的 网 络 ; 术语 网 
络 互联 (internetting) 就 是 用 来 描述 该 项 工作 的 。 

这 些 体 系 结构 的 原则 体现 在 TCP 中 。 然 而 ，TCP 的 早期 版 本 与 今天 的 TCP 差异 很 大 。 
TCP 的 早期 版 本 将 通过 端 系统 重 传 的 可 靠 按 序数 据 传递 ( 仍 是 今天 的 TCP 的 一 部 分 ) 与 
转发 功能 (今天 该 功能 由 IP HÍT) 相 结 合 。TCP 的 早期 实验 以 及 认识 到 对 诸如 分 组 语音 
这 样 的 应 用 程序 中 不 可 靠 的 、 非 流 控制 的 、 端 到 端 传递 服务 的 重要 性 ， 导 致 IP 从 TCP 中 
分 离 出 来 ， 并 研制 了 UDP 协议。 我 们 今天 看 到 的 3 个 重要 的 因特网 协议 一 一 TCP、UDP 和 
IP， 到 20 世纪 70 年 代 末 在 概念 上 已 经 完成 。 

除了 DARPA 的 因特网 相关 研究 外 ， 许 多 其 他 重要 的 网 络 活动 也 在 进行 中 。 在 夏威夷 ， 
Norman Abramson 正在 研制 ALOHAnet， 这 是 一 个 基于 分 组 的 无 线 电网 络 ， 它 使 在 夏威夷 岛 
上 的 多 个 远程 站 点 互相 通信 。ALOHA 协议 [Abramson 1970] 是 第 一 个 多 路 访问 协议 ， 允 
许 地 理 上 分 布 的 用 户 共 享 单一 的 广播 通信 媒体 〈 一 个 无 线 电 频 率 ) Metcalfe 和 Boggs 基于 
Abramson 的 多 路 访问 协议 ， 研 制 了 用 于 有 线 共 享 广播 网 络 的 以 太 网 协议 [Metcalfe 1976 | 。 
令 人 感 兴趣 的 是 ，Metcalfe 和 Boggs 的 以 太 网 协议 是 由 连接 多 台 PC、 打 印 机 和 共享 磁盘 在 
一 起 的 需求 所 激励 的 [Perkins 1994]。 在 PC 革命 和 网 络 爆 炸 的 25 年 之 前 ，Metcalfe 和 
Boggs 就 商定 了 今天 PC LAN 的 基础 。 


1.7.3 网 络 的 激增 : 1980 ~1990 


到 了 20 世纪 70 FRR, KA 200 台 主 机 与 ARPAnet 相连 。 到 了 20 世纪 80 FRX, 
连 到 公共 因特网 的 主机 数量 达到 100 000 台 ， 那 时 的 公共 因特网 是 网 络 的 联盟 ， 看 起 来 非 
常 像 今天 的 因特网 。20 世纪 80 年 代 是 联网 主机 数量 急剧 增长 的 时 期 。 

这 种 增长 是 由 几 个 显著 成 果 即 创建 计算 机 网 络 将 大 学 连接 到 一 起 引起 的 。BITNET 为 
位 于 美国 东北 部 的 几 个 大 学 之 间 提 供 了 电子 邮件 和 文件 传输 。 建 立 了 CSNET (计算 机 科学 
网 ) ， 以 将 还 没有 接 人 ARPAnet 的 大 学 研究 人 员 连 接 在 一 起 。1986 年 ， 建立 了 NSFNET， 
为 NSF 资助 的 超级 计算 中 心 提 供 接 人 。NSFNET 最 初 具 有 56kbps 的 主干 速率 ， 到 了 20 tit 
纪 80 年 代 末 ， 它 的 主干 运行 速率 是 1. 5Mbps， 并 成 为 连接 区 域 网 络 的 基本 主干 。 

在 ARPAnet 界 中 ,许多 今天 的 因特网 体系 结构 的 最 终 部 分 逐渐 变 得 清晰 起 来 。1983 
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年 1 月 1 日 见证 了 TCP/IP 作为 ARPAnet 新 的 标准 主机 协议 的 正式 部 署 ， 替 代 了 NCP 协 
iM, M NCP 到 TCP/IP 的 迁移 [RFC 801] 是 一 个 标志 性 事件 ， 所 有 主机 被 要 求 在 那天 转 
F] TCP/IP 上 去 。 在 20 世纪 80 年 代 后 期 ，TCP 进行 了 重要 扩展 ， 以 实现 基于 主机 的 拥 
塞 控 制 [Jacobson 1988 ] 。 还 研制 出 了 DNS (域名 系统 ) ， 用 于 将 人 可 读 的 因特网 名 字 (A 
如 gaia. cs. umass. edu) 映射 到 它 的 32 LORE IP 地 址 [RFC 1034], 

在 20 世纪 80 年 代 初 期 ， 在 ARPAnet (这 绝 大 多 数 是 美国 的 成 果 ) 发 展 的 同时 ， 法 国 
启动 了 Minitel 项 目 ， 这 个 雄心 勃勃 的 计划 是 让 数据 网 络 进 入 每 个 家 庭 。 在 法 国政 府 的 文 
持 下 ，Minitel 系统 由 公共 分 组 交换 网 络 〈 基 于 X. 25 协议 集 ) Minitel IRE AAMRA A 
低速 调制 解 调 器 的 廉价 终端 组 成 。Minitel 于 1984 年 取得 了 巨大 的 成 功 ， 当 时 法 国政 府 向 
每 个 需要 的 住户 免费 分 发 一 个 Minitel 终端 。Minitel 站 点 包括 免费 站 点 〈 如 电话 目录 站 点 ) 
以 及 一 些 专用 站 点 ， 这 些 专用 站 点 根据 每 个 用 户 的 使 用 来 收取 费用 。 在 20 世纪 90 年 代 中 
期 的 易 盛 时 期 Minitel 提供 了 20 000 多 种 服务 ， 涵 盖 从 家 庭 银 行 到 特殊 研究 数据 库 的 广泛 
范围 。Minitel 在 大 量 法 国家 庭 中 存在 了 10 年 后 ， 大 多 数 美国 人 才 听 说 因特网 。 


1.7.4 因特网 爆炸 : 20 世纪 90 年代 


20 世纪 90 年 代 出 现 了 许多 事件 ， 这 些 事件 标志 着 因特网 持续 革命 和 很 快 到 来 的 商业 
化 。 作 为 因特网 祖先 的 ARPAnet 已 不 复 存在 。1991 年 ，NSFNET 解除 了 对 NSFNET 用 于 商 
业 目 的 的 限制 。NSFNET 自身 于 1995 年 退役 ， 这 时 因特网 主干 流量 则 由 商业 因特网 服务 提 
供 商 负 责 承 载 。 

然而 ，20 世纪 90 年 代 的 主要 事件 是 万 维 网 (Word Wide Web) 应 用 程序 的 出 现 ， 它 
将 因特网 带 入 世界 上 数 以 百 万 计 的 家 庭 和 商业 中 。Web 作为 一 个 平台 ， 也 引入 和 配置 了 数 
百 个 新 的 应 用 程序 ， 其 中 包括 搜索 (如 谷歌 和 Bing) 、 因 特 网 商务 (如 亚马逊 和 eBay) 以 
及 社交 网 络 〈 如 脸 书 ) ， 对 这 些 应 用 程序 我 们 今天 已 经 习以为常 了 。 

Web 是 由 Tim Berners- Lee F 1989 ~ 1991 年 间 在 CERN 发 明 的 [ Berners- Lee 1989 | , 
最 初 的 想法 源 于 20 世纪 40 年 代 Vannevar Bush [ Bush 1945] 和 20 世纪 60 年 代 以 来 Ted 
Nelson | Xanadu 2012] 在 超 文 本 方面 的 早期 工作 。Berners- Lee 和 他 的 同事 研制 了 HTML, 
HTTP、Web 服务 器 和 浏览 器 的 初始 版 本 ， 这 是 Web 的 4 个 关键 部 分 。 到 了 1993 年 年 底 前 
ja, KAA 200 台 Web 服务 器 在 运行 ， 而 这 些 只 是 正在 出 现 的 Web 服务 天 的 冰山 一 角 。 
就 在 这 个 时 候 ， 几 个 研究 人 员 研 制 了 具有 GUI 接口 的 Web 浏览 器 ， 其 中 的 Marc Andrees- 
sen 和 Jim Clark 一 起 创办 了 Mosaic Communications 公司 ， 该 公司 就 是 后 来 的 Netscape 通信 
公司 [Cusmano 1998; Quittner 1998 ] 。 到 了 1995 年 ， 大 学 生 们 每 天 都 在 使 用 Netscape X 
览 器 在 Web 上 冲浪 。 大 约 在 这 段 时 间 ， 大 大 小 小 的 公司 都 开始 运行 Web 服务 器 ， 并 在 
Web 上 处 理 商 务 。1996 年 ， 微 软 公司 开始 开发 浏览 器 ， 这 导致 了 Netscape 和 微软 之 间 的 
浏览 器 之 战 ， 并 以 微软 公司 在 几 年 后 获胜 而 告终 [Cusumano 1998 ] 。 

20 世纪 90 年 代 的 后 5 年 ， 随 着 主流 公司 和 数 以 千 计 的 初创 公司 创造 了 大 量 因特网 产 
品 和 服务 ， 因 特 网 到 了 飞速 增长 和 创新 的 时 期 。 到 了 2000 年 末 ， 因 特 网 已 经 文 持 数 百 流 
行 的 应 用 程序 ， 包 括 以 下 4 种 备 受 欢迎 的 应 用 程序 : 

e 电子 邮件 ， 包 括 附件 和 Web 可 访问 的 电子 邮件 。 

。 Web， 包 括 Web 浏览 和 因特网 商务 。 

e 即时 讯息 (instant messaging) ， 具 有 联系 人 列表 。 

e MP3 的 对 等 (peer-to-peer) 文件 共享 ， 由 Napster 开创 。 
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值得 一 提 的 是 ， 前 两 个 应 用 程序 出 自 专 业 研究 机 构 ， 而 后 两 个 却 由 一 些 年 轻 创 业者 所 
发 明 。 

1995 ~2001 年 ， 这 段 时 间 也 是 因特网 在 金融 市 场 上 急 转 突变 的 时 期 。 在 成 为 有 利 可 图 
的 公司 之 前 ， 数 以 百 计 的 因特网 初创 公司 靠 首 次 公开 募股 CIPO) 并 在 股票 市 场 上 交易 起 
家 。 许 多 公司 身价 数 十 亿美 元 ， 却 没有 任何 主要 的 收入 渠道 。 因 特 网 的 股票 在 2000 ~ 2001 
年 月 盘 ， 导 致 许多 初创 公司 倒闭 。 不 过 ， 也 有 许多 公司 成 为 因特网 世界 的 大 赢家 ， 包 括 微 
ike BPR WE, e-Bay, ARAWE H. 


1.7.5 最 新 发 展 


计算 机 网 络 中 的 变革 继续 以 急促 的 步伐 前 进 。 所 有 的 前 沿 研 究 正 在 取得 进展 ， 包 括 部 
署 更 快 的 路 由 器 和 在 接 人 网 和 网 络 主干 中 提供 更 高 的 传输 速率 。 但 下 列 进展 值得 特别 
RE : 

o H2000 年 开始 ， 我 们 见证 了 家 庭 宽带 因特网 接 入 的 积极 部 署 一 一 不 仅 有 电线 调制 
解 调 器 和 DSL， 而 且 有 光纤 到 户 ， 这 些 在 1.2 节 中 讨论 过 。 这 种 高 速 因特网 为 丰 
富 的 视频 应 用 创造 了 和 条件， 包括 用 户 生 成 的 视频 的 分 发 (例如 YouTube) 、 电 影 和 
电视 节目 的 按 需 流 〈 例 如 Netflix) 以 及 多 人 视频 会 议 (例如 Skype, Facetime 和 
Google Hangouts ) 。 

© 高 速 (54Mbps 及 更 高 ) 公共 WiFi 网 络 和 经 过 4G 蜂窝 电话 网 的 中 速 ( 几 十 Mbps) 
因特网 接 人 越 来 越 普及 ， 不 仅 使 在 运动 中 保持 持续 连接 成 为 可 能 ， 也 产生 了 新 型 
特定 位 置 应 用 ， 如 Yelp, Tinder, Yik Yak 和 Waz。2011 年 ， 与 因特网 连接 的 无 线 
设备 的 数量 超过 了 有 线 设 备 的 数量 。 高 速 无 线 接 人 为 手持 计算 机 (iPhone、 安 早 
手机 、iPad 等 ) 的 迅速 出 现 提供 了 舞台 ， 这 些 手持 计算 机 具有 对 因特网 持续 不 断 
和 无 拘束 接 入 的 优点 。 

o 诸如 脸 书 、Instagram 、 推 特 (Twitter) 和 微 信 (在 中 国 极为 流行 ) 这 样 的 在 线 
社交 网 络 已 经 在 因特网 之 上 构建 了 巨大 的 人 际 网 络 。 这 些 社 交 网 络 ， 许 多 广泛 
用 于 发 送 消 息 以 及 照片 分 享 。 许 多 因特网 用 户 今 天 主要 “生活 ”在 一 个 或 多 个 
社交 网 络 中 。 通 过 他 们 的 API， 在 线 社交 网 络 为 新 的 联网 应 用 和 分 布 式 游戏 创建 
TFB 

e 如 在 1.3.3 节 中 所 讨论 的 ， 在 线 服 务 提供 商 如 谷歌 和 微软 已 经 广泛 部 署 了 自己 的 
专用 网 络 。 该 专用 网 络 不 仅 将 它们 分 布 在 全 球 的 数据 中 心 连 接 在 一 起 ， 而 且 通 过 
直接 与 较 低层 ISP 对 等 连接 ， 能够 尽 可 能 绕 过 因特网 。 因 此 ， 合 歌 几 乎 可 以 瞬间 
提供 搜索 结果 和 电子 邮件 访问 ,仿佛 它 们 的 数据 中 心 运行 在 自己 的 计算 机 中 一 样 。 

© 许多 因特网 商务 公司 在 “ 云 ”( 如 亚马逊 的 EC2 、 谷 歌 的 应 用 引擎 、 微 软 的 Azure ) 
中 运行 它们 的 应 用 。 许 多 公司 和 大 学 也 已 经 将 它们 的 因特网 应 用 (如 电子 邮件 和 
Web 托管 ) 迁移 到 云 中 。 云 公司 不 仅 可 以 为 应 用 提供 可 扩展 的 计算 和 存储 环境 ， 
也 可 为 应 用 提供 对 其 高 性 能 专用 网 络 的 隐 含 访问 。 


1.8 人 小结 


在 本 章 中 ， 我 们 涉及 了 大 量 的 材料 ! 我 们 已 经 看 到 构成 特别 的 因特网 以 及 一 般 的 计算 
机 网 络 的 各 种 硬件 和 软件 。 我 们 从 网 络 的 边缘 开始 ， 观 察 端 系统 和 应 用 程序 ， 以 及 运行 在 
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端 系 统 上 为 应 用 程序 提供 的 运输 服务 。 接 着 我 们 也 观察 了 通常 能 够 在 接 人 网 中 找到 的 链 路 
层 技术 和 物理 媒体 。 然 后 我 们 进入 网 络 核心 更 深入 地 钻研 网 络 ， 看 到 分 组 交换 和 电路 交换 
是 通过 电信 网 络 传输 数据 的 两 种 基本 方法 ， 并 且 探 讨 了 每 种 方法 的 长 处 和 短处 。 我 们 也 研 
究 了 全 球 性 因特网 的 结构 ， 知 道 了 因特网 是 网 络 的 网 络 。 我 们 看 到 了 因特网 的 由 较 高 层 和 
较 低 层 ISP 组 成 的 等 级 结构 ， 人 允许 该 网 络 扩展 为 包括 数 以 千 计 的 网 络 。 

在 这 个 概述 性 章节 的 第 二 部 分 ， 我 们 研究 了 计算 机 网 络 领域 的 几 个 重要 主题 。 我 们 首 
先 研 究 了 分 组 交换 网 中 的 时 延 、 吞 吐 量 和 丢 包 的 原因 。 我 们 研究 得 到 传输 、 传 播 和 排队 时 
延 以 及 用 于 吞吐 量 的 简单 定量 模型 ;我们 将 在 整 本 书 的 课 后 习题 中 多 处 使 用 这 些 时 延 模 
型 。 接 下 来 ， 我们 研究 了 协议 分 层 和 服务 模型 、 网 络 中 的 关键 体系 结构 原则 ， 我 们 将 在 本 
书 多 处 引用 它们 。 我 们 还 概述 了 在 今天 的 因特网 中 某 些 更 为 流行 的 安全 攻击 。 我 们 用 计算 
机 网 络 的 简要 历史 结束 我 们 对 网 络 的 概述 。 第 1 草本 身 就 构成 了 计算 机 网 络 的 小 型 课程 。 

Alt, 第 1 章 中 的 确 涉及 了 大 量 的 背景 知识 ! 如 果 你 有 些 不 知 所 云 ， 请 不 要 着 急 。 在 
后 继 几 章 中 我 们 将 重新 回顾 这 些 概 念 ， 更 为 详细 地 研究 它们 〈 那 是 承诺 ， 而 不 是 威胁 !) 。 
此 时 ， 我 们 希望 你 完成 本 章 内 容 的 学 习 时 ， 对 构建 网 络 的 众多 元 素 的 直觉 越 来 越 敏锐 ， 对 
网 络 词汇 越 来 越 精 通 〈 不 妨 经 常 回 过 头 来 查阅 本 章 ) ， 对 更 加 深入 地 学 习 网 络 的 愿望 越 来 
越 强 烈 。 这 些 也 是 在 本 书 的 其 余部 分 我 们 将 面临 的 任务 。 


本 书 的 路 线 图 


在 开始 任何 旅行 之 前 ， 你 总 要 先 查 看 路 线 图 ， 以 便 更 为 熟悉 前 面 的 主要 道路 和 交叉 路 
口 。 对 于 我 们 即将 开启 的 这 段 “旅行 ”而 言 ， 其 最 终 目 的 地 是 次 入 理解 计算 机 网 络 “是 
什么 、 怎 么 样 和 为 什么 ”等 内 容 。 我 们 的 路 线 图 是 本 书 各 章 的 顺序 : 

第 1 章 计算 机 网 络 和 因特网 

第 2 章 应 用 层 

第 3 章 运输 层 

第 4 章 网 络 层 : 数据 平面 

PSA 网 络 层 : 控制 平面 

第 6 章 链 路 层 和 局 域 网 

第 7 草 无 线 网 络 和 移动 网 络 

第 8 章 计算 机 网 络 中 的 安全 

第 9 章 多 媒体 网 络 

第 2 ~6 章 是 本 书 的 5 个 核心 章 。 应 当 注 意 的 是 ， 这 些 章 都 围绕 5 层 因 特 网 协议 栈 上 
面 的 4 层 而 组 织 ， 其 中 一 章 对 应 一 层 。 要 进一步 注意 的 是 ， 我 们 的 旅行 将 从 因特网 协议 栈 
的 顶部 即 应 用 层 开 始 ， 然 后 向 下 面 各 层 进行 学 习 。 这 种 自 顶 向 下 旅行 背后 的 基本 原理 是 ， 
一 旦 我 们 理解 这 些 应 用 程序 ， 就 能 够 理解 支持 这 些 应 用 程序 所 需 的 各 种 网 络 服务 。 然 后 能 
够 依次 研究 可 能 由 网 络 体 系 结构 实现 的 服务 的 各 种 方式 。 较 早 地 涉及 应 用 程序 ， 也 能 够 对 
学 习 本 课程 其 余部 分 提供 动力 。 

第 7 ~9 章 关 注 现 代 计 算 机 网 络 中 的 3 个 极为 重要 的 (并 且 在 某 种 程度 上 是 独立 的 ) 
主题 。 在 第 7 章 中 ， 我们 人 研究 了 无 线 网 络 和 移动 网 络 ， 包 括 无 线 LAN (其 中 有 WiFi AK 
F), BEEN (包括 GSM、3G 和 4G) 以 及 移动 性 (在 IP 网 络 和 GSM 网 络 中 的 )。 在 
第 8 章 中 ， 我 们 首先 学 习 加 密 和 网 络 安全 的 基础 知识 ， 然 后 研究 基础 理论 如 何 应 用 于 各 种 
各 样 的 因特网 环境 。 在 最 后 一 章 (第 9 章 ) 中 ， 我 们 研究 了 音频 和 视频 应 用 ， 例 如 因特网 
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电话 、 视 频 会 议和 流 式 存储 媒体 。 此 外 ， 还 讨论 如 何 设计 分 组 交换 网 络 以 对 音频 和 视频 应 
用 程序 提供 一 致 的 服务 质量 。 


课 后 习题 和 问题 





1.14% 

R1.“ 主 机 ”和 “ 端 系统 ”之 间 有 什么 不 同 ? 列举 几 种 不 同类 型 的 端 系统 。Web 服务 器 是 一 种 端 系统 吗 ? 

R2. “协议 ”一 词 常 被 用 于 描述 外 交 关 系 。 维 基 百 科 是 怎样 描述 外 交 协 议 的 ? 

R3. 标准 对 于 协议 为 什么 重要 ? 

1.2 节 

R4. 列 出 6 种 接 人 技术 。 将 它们 分 类 为 住宅 接 人 、 公 司 接 人 或 广 域 无 线 接 人 。 

RS. HFC 传输 速率 在 用 户 间 是 专用 的 还 是 共享 的 ? 在 下 行 HFC 信道 中 ， 可 能 出 现 碰 撞 吗 ? 为 什么 ? 

R6. 列 出 你 所 在 城市 中 的 可 供 使 用 的 住宅 接 人 技术 。 对 于 每 种 类 型 的 接 人 方式 ， 给 出 所 宣称 的 下 行 速率 、 
上 行 速 率 和 每 月 的 价格 。 

R7. 以 太 LAN 的 传输 速率 是 多 少 ? 

R8. 能 够 运行 以 太 网 的 一 些 物理 媒体 是 什么 ? 

R9. 拨号 调制 解 调 器 、HFC、DSL 和 FTTH 都 用 于 住宅 接 人 。 对 于 这 些 技术 ， 给 出 每 种 技术 的 传输 速率 的 
范围 ， 并 讨论 它们 的 传输 速率 是 共享 的 还 是 专用 的 。 

R10. 描述 今天 最 为 流行 的 无 线 因特网 接 人 技术 。 对 它们 进行 比较 和 对 照 。 

1.3 节 

R11. 假定 在 发 送 主机 和 接收 主机 间 只 有 一 台 分 组 交换 机 。 发 送 主 机 和 交换 机 间 以 及 交换 机 和 接收 主机 间 
的 传输 速率 分 别 是 R 和 R,。 假 设 该 交换 机 使 用 存储 转发 分 组 交换 方式 ， 发 送 一 个 长 度 为 上 的 分 组 
的 端 到 端 总 时 延 是 什么 ? (忽略 排队 时 延 、 传 播 时 延 和 处 理 时 延 。) 

R12. 与 分 组 交换 网 络 相 比 ， 电 路 交换 网 络 有 哪些 优点 ? 在 电路 交换 网 络 中 ，TDM 比 FDM 有 哪些 优点 ? 

R13. 假定 用 户 共享 一 条 2Mbps 链 路 。 同 时 假定 当 每 个 用 户 传 输 时 连续 以 1Mbps 传输 ， 但 每 个 用 户 仅 传输 
20% 的 时 间 。 
a. 当 使 用 电路 交换 时 ， 能 够 支持 多 少 用 户 ? 
b. 作为 该 题 的 后 继 问题 ， 假 定 使 用 分 组 交换 。 为 什么 如 果 两 个 或 更 少 的 用 户 同时 传输 的 话 ， 在 链 

路 前 面 基 本 上 没有 排队 时 延 ? 为 什么 如 果 3 个 用 户 同时 传输 的 话 ， 将 有 排队 时 延 ? 
c. 求 出 某 指定 用 户 正 在 传输 的 概率 。 
d 假定 现在 有 3 个 用 户 。 求 出 在 任何 给 定 的 时 间 ， 所 有 3 个 用 户 在 同时 传输 的 概率 。 求 出 队列 增长 
的 时 间 比 率 。 

R14. 为 什么 等 级 结构 中 级 别 相同 的 两 个 ISP 通常 互相 对 等 ? 某 IXP 是 如 何 挣 钱 的 ? 

RIS. 某 些 内 容 提 供 商 构建 了 自己 的 网 络 。 描 述 谷 歌 的 网 络 。 内 容 提 供 商 构建 这 些 网 络 的 动机 是 什么 ? 

1.4 节 

R16. 考虑 从 某 源 主机 跨越 一 条 固定 路 由 向 某 目的 主机 发 送 一 分 组 。 列 出 端 到 端 时 延 中 的 时 延 组 成 成 分 。 
这 些 时 延 中 的 哪些 是 固定 的 ， 哪 些 是 变化 的 ? 

R17. 访问 配套 Web 网 站 上 有 关 传 输 时 延 与 传播 时 延 的 Java 小 程序 。 在 速率 、 传 播 时 延 和 可 用 的 分 组 长 
度 之 中 找 出 一 种 组 合 ， 使 得 该 分 组 的 第 一 个 比特 到 达 接 收 方 之 前 发 送 方 结束 了 传输 。 找 出 另 一 种 组 
合 ， 使 得 发 送 方 完成 传输 之 前 ， 该 分 组 的 第 一 个 比特 到 达 了 接收 方 。 

R18. 一 个 长 度 为 1000 字 节 的 分 组 经 距离 为 2500km 的 链 路 传播 ， 传 播 速率 为 2.5 x 10° m/s 并 且 传 输 速 率 
为 2Mbps， 它 需要 用 多 长 时 间 ? 更 为 一 般 地 ， 一 个 长 度 为 上 的 分 组 经 距离 为 d 的 链 路 传播 ， 传 播 速 
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率 为 并且 传输 速率 为 R bps， 它 需要 用 多 长 时 间 ? 该 时 延 与 传输 速率 相关 吗 ? 
R19. 假定 主机 A 要 向 主机 B 发 送 一 个 大 文件 。 从 主机 A 到 主机 B 的 路 径 上 有 3 段 链 路 ， 其 速率 分 别 为 
R, =500kbps, R, =2Mbps, R, =1Mbps。 
a 假定 该 网 络 中 没有 其 他 流量 ， 该 文件 传送 的 吞吐 量 是 多 少 ? 
b. 假定 该 文件 为 4MB。 用 吞吐 量 除 以 文件 长 度 ， 将 该 文件 传输 到 主机 B 大 致 需要 多 长 时 间 ? 
c. 重复 (a) 和 (b) ， 只 是 这 时 R, 减 小 到 100kbps。 
R20. 假定 端 系统 A 要 向 端 系统 B 发 送 一 个 大 文件 。 在 一 个 非常 高 的 层次 上 ， 描 述 端 系统 怎样 从 该 文件 生 
成 分 组 。 当 这 些 分 组 之 一 到 达 某 分 组 交换 机 时 ， 该 交换 机 使 用 分 组 中 的 什么 信息 来 决定 将 该 分 组 转 
发 到 哪 一 条 链 路 上 ? 因特网 中 的 分 组 交换 为 什么 可 以 与 驱车 从 一 个 城市 到 另 一 个 城市 并 沿途 询问 方 
向 相 类 比 ? 
. 访问 配套 Web 站 点 的 排队 和 丢 包 Java 小 程序 。 最 大 发 送 速率 和 最 小 的 传输 速率 是 多 少 ? 对 于 这 
些 速率 ， 流 量 强度 是 多 大 ? 用 这 些 速率 运行 该 Java 小 程序 并 确定 出 现 丢 包 要 花费 多 长 时 间 ? 然后 
第 二 次 重复 该 实验 ， 再 次 确定 出 现 丢 包 花 费 多 长 时 间 。 这 些 值 有 什么 不 同 ? 为 什么 会 有 这 种 
现象 ? 
EST 
R22. 列 出 一 个 层次 能 够 执行 的 5 个 任务 。 这 些 任务 中 的 一 个 〈 或 两 个 ) 可 能 由 两 个 (或 更 多 ) 层次 执 
行 吗 ? 
R23. 因特网 协议 栈 中 的 5 个 层次 有 哪些 ?在 这 些 层次 中 ， 每 层 的 主要 任务 是 什么 ? 
R24. 什么 是 应 用 层 报 文 ? 什么 是 运输 层 报 文 段 ? 什么 是 网 络 层 数据 报 ? 什么 是 链 路 层 帧 ? 
R25. 路 由 器 处 理 因 特 网 协议 栈 中 的 哪些 层次 ?” 链 路 层 交换 机 处 理 的 是 哪些 层次 ? 主机 处 理 的 是 哪些 
层次 ? 
1.6 
R26. 病毒 和 蠕虫 之 间 有 什么 不 同 ? 
R27. 描述 如 何 产 生 一 个 僵尸 网 络 ， 以 及 僵尸 网 络 是 怎样 被 用 于 DDoS 攻击 的 。 
R28. 假定 Alice 和 Bob 经 计算 机 网 络 互相 发 送 分 组 。 假 定 Trudy 将 自己 安置 在 网 络 中 ， 使 得 她 能 够 俘获 由 
Alice 发 送 的 所 有 分 组 ， 并 发 送 她 希望 给 Bob 的 东西 ; 她 也 能 够 俘获 由 Bob 发 送 的 所 有 分 组 ， 并 发 
送 她 希望 给 Alice 的 东西 。 列 出 在 这 种 情况 下 Trudy 能 够 做 的 某 些 恶意 的 事情 。 
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习题 


Pl. 设计 并 描述 在 自动 柜员 机 和 银行 的 中 央 计 算 机 之 间 使 用 的 一 种 应 用 层 协 议 。 你 的 协议 应 当 人 允许 验证 
用 户 卡 和 口令 ,查询 账目 结算 (这些 都 在 中 央 计 算 机 中 进行 维护 )， 支 取 账 目 ( 即 向 用 户 支 付 钱 )。 
你 的 协议 实体 应 当 能 够 处 理 取 钱 时 账目 中 钱 不 够 的 常见 问题 。 通 过 列 出 自动 柜员 机 和 银行 中 央 计 算 
机 在 报 文 传输 和 接收 过 程 中 交换 的 报 文 和 采取 的 动作 来 定义 你 的 协议 。 使 用 类 似 于 图 1-2 所 示 的 图 ， 
拟定 在 简单 无 差错 取 钱 情况 下 该 协议 的 操作 。 明 确 地 阐述 在 该 协议 中 关于 底层 端 到 端 运输 服务 所 做 
的 假设 。 

P2. 式 (1-1) 给 出 了 经 传输 速率 为 RR 的 NN 段 链 路 发 送 长 度 L 的 一 个 分 组 的 端 到 端 时 延 。 对 于 经 过 NN 段 链 
路 一 个 接 一 个 地 发 送 P 个 这 样 的 分 组 ， 一 般 化 地 表示 出 这 个 公式 。 

P3. 考虑 一 个 应 用 程序 以 稳定 的 速率 传输 数据 (例如 ， 发 送 方 每 k 个 时 间 单 元 产生 一 个 NN 比特 的 数据 单 
元 ， 其 中 上 较 小 且 固 定 ) 。 另 外 ， 当 这 个 应 用 程序 启动 时 ， 它 将 连续 运行 相当 长 的 一 段 时 间 。 回 答 下 
列 问题 ， 简 要 论证 你 的 回答 : 

a 是 分 组 交换 网 还 是 电路 交换 网 更 为 适合 这 种 应 用 ? 为 什么 ? 
b. 假定 使 用 了 分 组 交换 网 ， 并 且 该 网 中 的 所 有 流量 都 来 自如 上 所 述 的 这 种 应 用 程序 。 此 外 ， 假 定 该 
应 用 程序 数据 传输 速率 的 总 和 小 于 每 条 链 路 的 各 自 容量 。 需 要 某 种 形式 的 拥塞 控制 吗 ? 为 什么 ? 
P4. 考虑 在 图 1-13 中 的 电路 交换 网 。 回 想 在 每 条 链 路 上 有 4 条 链 路 ， 以 顺 时 针 方向 标记 四 台 交 换 机 A, 
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B, C#MD, 

a. 在 该 网 络 中 ， 任 何 时 候 能 够 进行 同时 连接 的 最 大 数量 是 多 少 ? 

b. 假定 所 有 连接 位 于 交换 机 A A C 之 间 。 人 能够 进行 同时 连接 的 最 大 数量 是 多 少 ? 

c. 假定 我 们 要 在 交换 机 A 和 C 之 间 建 立 4 条 连接 ， 在 交换 机 B 和 DD 之 间 建 立 另 外 4 条 连接 。 我 们 能 
够 让 这 些 呼叫 通过 这 4 条 链 路 建立 路 由 以 容纳 所 有 8 条 连接 吗 ? 

PS. 回顾 在 1.4 节 中 的 车 队 的 类 比 。 假 定 传播 速度 为 100km/h。 

a. 假定 车 队 旅 行 150km: 在 一 个 收费 站 前 面 开 始 ， 通 过 第 二 个 收费 站 ， 并 且 正 好 在 第 三 个 收费 站 后 
面 结束 。 其 端 到 端 时 延 是 多 少 ? 
b. 重复 (a) ， 现 在 假定 车 队 中 有 8 辆 汽车 而 不 是 10 辆 。 

P6. 这 个 习题 开始 探讨 传播 时 延 和 传输 时 延 ， 这 是 数据 网 络 中 的 两 个 重要 概念 。 考 虑 两 台 主 机 A 和 B 由 
一 条 速率 为 R bps 的 链 路 相连 。 假 定 这 两 台 主 机 相隔 m 米 ， 沿 该 链 路 的 传播 速率 为 ; m/s。 主机 A 癌 
主机 B 发 送 长 度 工 比特 的 分 组 。 

a. H m 和 ;来 表示 传播 时 延 dorop o 

b. 用 LL 入 来 确定 该 分 组 的 传输 时 间 dans o 

c 忽略 处 理 和 排队 时 延 ， 得 出 端 到 端 时 延 的 表达 式 。 

d. 假定 主机 A 在 时 刻 1=0 开始 传输 该 分 组 。 在 时 刻 1=d,,,,， 该 分 组 的 最 后 一 个 比特 在 什么 地 方 ? 
e. 假定 dpp KF dimno ERTZ t= d,s， 该 分 组 的 第 一 个 比特 在 何 处 ? 

f. 假定 dp 小 于 dimno ERTZ t= ds， 该 分 组 的 第 一 个 比特 在 何 处 ? 

g 假定 s=2.5x10 ,上 =120 比特 ，R =56kbps。 求 出 使 dw, 等 于 ds 的 距离 Mm, 

P7. 在 这 个 习题 中 ,我 们 考虑 从 主机 A 向 主机 B 通过 分 组 交换 网 发 送 语音 ( VolP)。 主 机 A 将 模拟 语音 
转换 为 传输 中 的 64kbps 数字 比特 流 。 然 后 主机 A 将 这 些 比特 分 为 56 字 节 的 分 组 。A 和 B 之 间 有 一 条 
链 路 : 它 的 传输 速率 是 2Mbps， 传 播 时 延 是 10ms。 一 旦 A 收集 了 一 个 分 组 ， 就 将 它 向 主机 B 发 送 。 
一 旦 主机 B 接收 到 一 个 完整 的 分 组 ， 它 将 该 分 组 的 比特 转换 成 模拟 信号 。 从 比特 产生 (从 位 于 主机 
A 的 初始 模拟 信号 起 ) 的 时 刻 起 ， 到 该 比特 被 解码 (在 主机 B 上 作为 模拟 信号 的 一 部 分 ) ， 花 了 多 少 
时 间 ? 

P8. 假定 用 户 共 享 一 条 3Mbps 的 链 路 。 又 设 每 个 用 户 传 输 时 要 求 130kbps， 但 是 每 个 用 户 仅 有 10% 的 时 间 
传输 。( 参 见 1. 3 节 中 关于 “分 组 交换 与 电路 交换 的 对 比 ” 的 讨论 。) 

a_ 当 使 用 电路 交换 时 ， 能 够 支持 多 少 用 户 ? 

b. 对 于 本 习题 的 后 续 小 题 ， 假 定 使 用 分 组 交换 。 求 出 某 给 定 用 户 正 在 传输 的 概率 。 

c. 假定 有 120 个 用 户 。 求 出 在 任何 给 定时 刻 ， 实 际 有 个 用 户 在 同时 传输 的 概率 。( 提示 : 使 用 二 项 
式 分 布 。) 

d. 求 出 有 21 个 或 更 多 用 户 同 时 传输 的 概率 。 

P9. 考虑 在 1.3 节 “ 分 组 交换 与 电路 交换 的 对 比 ” 的 讨论 中 ， 给 出 了 一 个 具有 一 条 1Mbps 链 路 的 例子 。 
用 户 在 忙 时 以 100kbps 速率 产生 数据 ， 但 忙 时 仅 以 p =0. 1 的 概率 产生 数据 。 假 定 用 1Cbps 链 路 替代 
1Mbps 的 链 路 。 

a， 当 采用 电路 交换 技术 时 ， 能 被 同时 支持 的 最 大 用 户 数量 NN 是 多 少 ? 
b. 现在 考虑 分 组 交换 和 有 M 个 用 户 的 情况 。 给 出 多 于 NN 用户 发 送 数 据 的 概率 公式 (Hp M, N 
DA Ne 
P10. 考虑 一 个 长 度 为 了 的 分 组 从 端 系统 A 开始 ,经 3 段 链 路 传送 到 目的 端 系统 。 令 da s: MR, 表示 链 路 
i 的 长 度 、 传 播 速 度 和 传输 速率 (i=1，2，3)。 该 分 组 交换 机 对 每 个 分 组 的 时 延 为 du。 假定 没有 
排队 时 延 ， 用 d;、s;、Ri(i=1, 2, 3) 和 上 表示 ,该 分 组 总 的 端 到 端 时 延 是 什么 ”现在 假定 该 分 组 
是 1500 字 节 ， 在 所 有 3 条 链 路 上 的 传播 时 延 是 2.5 x 10 "m/s， 所 有 3 条 链 路 的 传输 速率 是 2Mbps， 
分 组 交换 机 的 处 理 时 延 是 3ms， 第 一 段 链 路 的 长 度 是 5000km， 第 二 段 链 路 的 长 度 是 4000km， 并 且 
最 后 一 段 链 路 的 长 度 是 1000km。 对 于 这 些 值 ， 该 端 到 端 时 延 为 多 少 ? 
Pll. 在 上 述 习 题 中 ,假定 R, =R, =R, =R H A, =0。 进 一 步 假定 该 分 组 交换 机 不 存储 转发 分 组 ， 而 是 
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在 等 待 分 组 到 达 前 立即 传输 它 收 到 的 每 个 比特 。 这 时 端 到 端 时 延 为 多 少 ? 

一 台 分 组 交换 机 接收 一 个 分 组 并 决定 该 分 组 应 当 转 发 的 出 链 路 。 当 某 分 组 到 达 时 ， 男 一 个 分 组 正在 

该 出 链 路 上 被 发 送 到 一 半 ， 还 有 4 个 其 他 分 组 正 等 待 传输 。 这 些 分 组 以 到 达 的 次 序 传输 。 假 定 所 有 

分 组 是 1500 字 节 并 且 链 路 速率 是 2Mbps。 该 分 组 的 排队 时 延 是 多 少 ? 在 更 一 般 的 情况 下 ， 当 所 有 分 

组 的 长 度 是 L， 传 输 速 率 是 尺 ， 当 前 正在 传输 的 分 组 已 经 传输 了 x 比特 ， 并 且 已 经 在 队列 中 有 个 

分 组 ， 其 排队 时 延 是 多 少 ? 

a. 假定 及 个 分 组 同时 到 达 一 条 当前 没有 分 组 传输 或 排队 的 链 路 。 每 个 分 组 长 为 L， 链 路 传输 速率 

为 R。 对 NN 个 分 组 而 言 ， 其 平均 排队 时 延 是 多 少 ? 

b. 现在 假定 每 隔 LN/R 秒 有 NN 个 分 组 同时 到 达 链 路 。 一 个 分 组 的 平均 排队 时 延 是 多 少 ? 

考虑 某 路 由 器 缓存 中 的 排队 时 延 。 令 1 表示 流量 强度 ; 即 ! = La/R。 假定 排队 时 延 的 形式 为 IL/R 

(1-1), He/<1, 

a. 写 出 总 时 延 即 排队 时 延 加 上 传输 时 延 的 公式 。 

b. 以 L/R 为 图 数 男 出 总 时 延 的 图 。 

S a 表示 在 一 条 链 路 上 分 组 的 到 达 率 (以 分 组 / 秒 计 ) ， 令 几 表 示 一 条 链 路 上 分 组 的 传输 率 (以 分 

组 / 秒 计 )。 基 于 上 述 习 题 中 推导 出 的 总 时 延 公式 ( 即 排队 时 延 加 传输 时 延 )， 推 导出 以 a 和 表示 

的 总 时 延 公式 。 

考虑 一 台 路 由 器 缓存 前 面 的 一 条 出 链 路 。 在 这 个 习题 中 ， 将 使 用 李 特 尔 (Little) AR, 这 是 排队 论 

中 的 一 个 著名 公式 。 令 NN 表示 在 缓存 中 的 分 组 加 上 被 传输 的 分 组 的 平均 数 。 令 a 表示 到 达 该 链 路 的 

分 组 速率 。 令 d 表示 一 个 分 组 历经 的 平均 总 时 延 ( 即 排队 时 延 加 传输 时 延 )。 李 特 尔 公式 是 N=a x 

d。 假定 该 缓存 平均 包含 10 个 分 组 ， 并 生平 均 分 组 排队 时 延 是 10ms。 该 链 路 的 传输 速率 是 100 分 

组 / 秒 。 使 用 李 特 尔 公 式 ， 在 没有 丢 包 的 情况 下 ， 平 均 分 组 到 达 率 是 多 少 ? 

a 对 于 不 同 的 处 理 速 率 、 传 输 速 率 和 传播 时 延 ， 给 出 1.4. 3 节 中 式 (1-2) 的 一 般 表 达 式 。 

b. 重复 (a) ， 不 过 此 时 假定 在 每 个 节点 有 平均 排队 时 延 duene o 

在 一 天 的 3 个 不 同 的 小 时 内 ， 在 同一 个 大 陆 上 的 源 和 目的 地 之 间 执 行 Traceroute, 

a. 在 这 3 个 小 时 的 每 个 小 时 中 ， 求 出 往返 时 延 的 均值 和 方差 。 

b. 在 这 3 个 小 时 的 每 个 小 时 中 ， 求 出 路 径 上 的 路 由 器 数量 。 在 这 些 时 段 中 ， 该 路 径 发 生变 化 了 吗 ? 

co 试图 根据 源 到 目的 地 Traceroute 分 组 通过 的 情况 ， 辨 明 ISP 网 络 的 数量 。 具 有 类 似 名 字 和 /或 类 似 
的 下 地 址 的 路 由 器 应 当 被 认为 是 同一 个 ISP 的 一 部 分 。 在 你 的 实验 中 ， 在 相 邻 的 ISP 间 的 对 等 接 
口 处 出 现 最 大 的 时 延 了 吗 ? 

d. 对 位 于 不 同 大 陆 上 的 源 和 目的 地 重复 上 述 内 容 。 比 较 大 陆 内 部 和 大 陆 之 间 的 这 些 结果 。 

a. 访问 站 点 www. traceroute. org ， 并 从 法 国 两 个 不 同 的 城市 向 位 于 美国 的 相同 的 目的 主机 执行 Tracer- 
oute。 在 这 两 个 Traceroute 中 ， 有 多 少 条 链 路 是 相同 的 ?大 西洋 沿岸 国家 的 链 路 相同 吗 ? 

. 重复 (a) ， 但 此 时 选择 位 于 法 国 的 一 个 城市 和 位 于 德国 的 另 一 个 城市 。 

c. 在 美国 挑选 一 个 城市 ， 然 后 向 位 于 中 国 的 两 个 不 同城 市 的 主机 执行 Traceroute。 在 这 两 次 Tracer- 
oute 中 有 多 少 链 路 是 相同 的 ?在 到 达 中 国 前 这 两 个 Traceroute 分 开 了 吗 ? 

考虑 对 应 于 图 1-20b 吞吐 量 的 例子 。 现 在 假定 有 MM 对 客户 -服务 器 而 不 是 10 XT, HR, OR, ALR 

别 表示 服务 器 链 路 、 客 户 链 路 和 网 络 链 路 的 速率 。 假 设 所 有 的 其 他 链 路 都 有 充足 容量 ， 并 且 除 了 由 

这 M 对 客户 -服务 右 产 生 的 流量 外 ， 网 络 中 没有 其 他 流量 。 推 导出 由 R, Rao RA M 表示 的 通用 
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. 考虑 图 1-19b。 现 在 假定 在 服务 器 和 客户 之 间 有 M 条 路 径 。 任 两 条 路 径 都 不 共享 任何 链 路 。 路 径 


k(k=1, =, M) 由 传输 速率 为 Rl ，R;，…，Rw AN 条 链 路 组 成 。 如 果 服 务 器 仅 能 够 使 用 一 条 路 径 
向 客户 发 送 数据 ， 则 该 服务 器 能 够 取得 的 最 大 吞吐 量 是 多 少 ? 如 果 该 服务 器 能 够 使 用 所 有 M 条 路 径 
发 送 数据 ， 则 该 服务 器 能 够 取得 的 最 大 吞吐 量 是 多 少 ? 

考虑 图 1-19b。 假 定 服务 器 与 客户 之 间 的 每 条 链 路 的 丢 包 概率 为 P， 且 这 些 链 路 的 丢 包 率 是 独立 的 。 
一 个 (由 服务 器 发 送 的 ) 分 组 成 功 地 被 接收 方 收 到 的 概率 是 多 少 ? 如 果 在 从 服务 器 到 客户 的 路 径 上 
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P23. 


P24. 


P25. 


P26. 
P27. 


P28. 


P29. 


P30. 


分 组 丢失 了 ， 则 服务 器 将 重 传 该 分 组 。 平 均 来 说 ， 为 了 使 客户 成 功 地 接收 该 分 组 ， 服 务 器 将 要 重 传 

该 分 组 多 少 次 ? 

考虑 图 1-19a。 假 定 我 们 知道 沿 着 从 服务 器 到 客户 的 路 径 的 瓶颈 链 路 是 速率 为 R, bps 的 第 一 段 链 路 。 

假定 我 们 从 服务 器 向 客户 发 送 紧 密 相连 的 一 对 分 组 ， 且 沿 这 条 路 径 没 有 其 他 流量 。 假 定 每 个 分 组 的 

长 度 为 L 比特 ， 两 条 链 路 具有 相同 的 传播 时 延 dyro o 

a. 在 目的 地 ， 分 组 的 到 达 间 隔 时 间 有 多 大 ? 也 就 是 说 ， 从 第 一 个 分 组 的 最 后 一 个 比特 到 达到 第 二 个 
分 组 最 后 一 个 比特 到 达 所 经 过 的 时 间 有 多 长 ? 

b. 现在 假定 第 二 段 链 路 是 瓶颈 链 路 ( 即 R. < R,)。 第 二 个 分 组 在 第 二 段 链 路 输入 队列 中 排队 是 可 能 
的 吗 ? 请 解释 原因 。 现 在 假定 服务 器 在 发 送 第 一 个 分 组 7 秒 之 后 再 发 送 第 二 个 分 组 。 为 确保 在 第 
二 段 链 路 之 前 没有 排队 ，7 必须 要 有 多 长 ? 试 解释 原因 。 

假设 你 希望 从 波士顿 向 洛杉矶 紧急 传送 40 x 10” 字 节 数 据 。 你 有 一 条 100Mbps 专用 链 路 可 用 于 传 

输 数据 。 你 是 愿意 通过 这 条 链 路 传输 数据 ， 还 是 愿意 使 用 FedEx 夜间 快递 来 交付 ? 解释 你 的 

理由 。 

假定 两 台 主 机 A 和 了 B 相隔 20 000km， 由 一 条 直接 的 R=2Mbps 的 链 路 相连 。 假 定 跨越 该 链 路 的 传播 

速率 是 2.5 x 10° m/s, 

a. 计算 带宽 -TIEF R -tropo 

b. 考虑 从 主机 A 到 主机 B 发 送 一 个 800 000 比特 的 文件 。 假 定 该 文件 作为 一 个 大 的 报 文 连续 发 送 。 
在 任何 给 定 的 时 间 ， 在 链 路 上 具有 的 比特 数量 最 大 值 是 多 少 ? 

c 给 出 带宽 -时 延 积 的 一 种 解释 。 

d. 在 该 链 路 上 一 个 比特 的 宽度 (以 米 计 ) BAD? 它 比 一 个 足球 场 更 长 吗 ? 

e 用 传播 速率 s、 带 宽 R ABBR m 的 长 度 表 示 ， 推 导出 一 个 比特 宽度 的 一 般 表 示 式 。 

对 于 习题 P25， 假 定 我 们 能 够 修改 R。 对 什么 样 的 RR 值 ， 一 个 比特 的 宽度 能 与 该 链 路 的 长 度 一 样 长 ? 

考虑 习题 P25， 但 此 时 链 路 的 速率 是 R=1Gbps。 

a. 计算 带宽 -时 延 积 Rd,.,。 

b. 考虑 从 主机 A 到 主机 B 发 送 一 个 800 000 比特 的 文件 。 假 定 该 文件 作为 一 个 大 的 报 文 连续 发 送 。 
在 任何 给 定 的 时 间 ， 在 链 路 上 具有 的 比特 数量 最 大 值 是 多 少 ? 

c. 在 该 链 路 上 一 个 比特 的 宽度 (以 米 计 ) 是 多 少 ? 

再 次 考虑 习题 P25。 

a. 假定 连续 发 送 ， 发 送 该 文件 需要 多 长 时 间 ? 

b. 假定 现在 该 文件 被 划分 为 20 个 分 组 ， 每 个 分 组 包含 40 000 比特 。 假 定 每 个 分 组 被 接收 方 确认 ， 
确认 分 组 的 传输 时 间 可 忽略 不 计 。 最 后 ， 假 定 前 一 个 分 组 被 确认 后 ， 发 送 方才 能 发 送 分 组 。 发 送 
该 文件 需要 多 长 时 间 ? 

c. 比较 (a) 和 (b) 的 结果 。 

假定 在 同步 卫星 和 它 的 地 球 基站 之 间 有 一 条 10Mbps 的 微波 链 路 。 每 分 钟 该 卫星 拍摄 一 幅 数 字 照 片 ， 

并 将 它 发 送 到 基站 。 假 定 传播 速率 是 2. 4 x 10 m/s。 

a. 该 链 路 的 传播 时 延 是 多 少 ? 

b. 带宽 -TIEF R + do 是 多 少 ? 

c Bx 表示 该 照片 的 大 小 。 对 于 这 条 微波 链 路 ， 能 够 连续 传输 的 « 最 小 值 是 多 少 ? 

考虑 1.5 节 中 我 们 在 分 层 讨 论 中 对 航空 旅行 的 类 比 ， 随 着 协议 数据 单元 向 协议 栈 底层 流动 ， 首 部 在 

增加 。 随 着 旅客 和 行李 移动 到 航线 协议 栈 底 部 ， 有 与 上 述 首 部 信息 等 价 的 概念 吗 ? 


. 在 包括 因特网 的 现代 分 组 交换 网 中 ， 源 主机 将 长 应 用 层 报 文 《如 一 个 图 像 或 音乐 文件 ) 分 段 为 较 小 


的 分 组 并 向 网 络 发 送 。 接 收 方 则 将 这 些 分 组 重新 装配 为 初始 报 文 。 我 们 称 这 个 过 程 为 报 文 分 段 。 
1-27 显示 了 一 个 报 文 在 报 文 不 分 段 或 报 文 分 段 情况 下 的 端 到 端 传 输 。 考 虑 一 个 长 度 为 8 x 10° Eb 
特 的 报 文 ， 它 在 图 1-27 中 从 源 发 送 到 目的 地 。 假 定 在 该 图 中 的 每 段 链 路 是 2Mbps。 忽 略 传播 、 排 队 
和 处 理 时 延 。 
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源 分 组 交换 机 分 组 交换 机 目的 地 
a) 没有 报 文 分 段 





源 分 组 交换 机 分 组 交换 机 目的 地 
b) 有 报 文 分 段 


图 1-27 端 到 端 报 文 传输 


a. 考虑 从 源 到 目的 地 发 送 该 报 文 且 没 有 报 文 分 段 。 从 源 主机 到 第 一 台 分 组 交换 机 移动 报 文 需要 多 长 
时 间 ? 记 住 ， 每 台 交 换 机 均 使 用 存储 转发 分 组 交换 ， 从 源 主 机 移动 该 报 文 到 目的 主机 需要 多 长 
时 间 ? 

. 现在 假定 该 报 文 被 分 段 为 800 个 分 组 ， 每 个 分 组 10 000 比特 长 。 从 源 主机 移动 第 一 个 分 组 到 第 一 
台 交换 机 需要 多 长 时 间 ? 从 第 一 台 交 换 机 发 送 第 一 个 分 组 到 第 二 台 交 换 机 ， 从 源 主 机 发 送 第 二 个 
分 组 到 第 一 台 交 换 机 各 需要 多 长 时 间 ? 什么 时 候 第 二 个 分 组 能 被 第 一 台 交 换 机 全 部 收 到 ? 

c. 当 进行 报 文 分 段 时 ， 从 源 主机 向 目的 主机 移动 该 文件 需要 多 长 时 间 ? 将 该 结果 与 (a) 的 答案 进 

行 比较 并 解释 之 。 

d. 除了 减 小 时 延 外 ， 使 用 报 文 分 段 还 有 什么 原因 ? 

. 讨论 报 文 分 段 的 缺点 。 

P32. 用 本 书 的 Web 网 站 上 的 报 文 分 段 小 Java 小 程序 进行 实验 。 该 Java 程序 中 的 时 延 与 前 一 个 习题 中 的 
时 延 相当 吗 ? 链 路 传播 时 延 是 怎样 影响 分 组 交换 (有 报 文 分 段 ) 和 报 文 交换 的 端 到 端 总 时 延 的 ? 
P33. 考虑 从 主机 A 到 主机 B 发 送 一 个 下 比特 的 大 文件 。A 和 B 之 间 有 三 段 链 路 (和 两 台 交 换 机 )， 并 且 
该 链 路 不 拥塞 ( 即 没 有 排队 时 延 )。 主 机 A 将 该 文件 分 为 每 个 为 $ 比特 的 报 文 段 ， 并 为 每 个 报 文 段 
增加 一 个 80 比特 的 首部 ， 形 成 L=80 +5 比特 的 分 组 。 每 条 链 路 的 传输 速率 为 R bps. RHEA A FB 

移动 该 文件 时 延 最 小 的 值 5。 忽略 传播 时 延 。 

P34. Skype 提供 了 一 种 服务 ,使 你 能 用 PC 向 普通 电话 打 电 话 。 这 意味 着 语音 呼叫 必须 通过 因特网 和 电话 

网 。 讨 论 这 是 如 何 做 到 的 。 
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sii Wireshark 实验 


“不 闻 不 若 闻 之 ， 闻 之 不 若 见 之 ， 见 之 不 若 知之 ， 知 之 不 若 行 之 。 





一 一 中 国 该 语 

一 个 人 通常 能 够 通过 以 下 方法 加 深 对 网 络 协议 的 理解 : 观察 它们 的 动作 和 经 常 摆 弄 它 们 ， 即 观察 两 
个 协议 实体 之 间 交 换 的 报 文 序列 ， 钻 研 协议 运行 的 细节 ， 使 协议 执行 某 些 动作 ， 观 察 这 些 动作 及 其 后 果 。 
这 能 够 在 仿真 环境 下 或 在 如 因特网 这 样 的 真实 网 络 环境 下 完成 。 在 本 书 配套 Web 站 点 上 的 Java 小 程序 采 
用 的 是 第 一 种 方法 。 在 Wireshark 实验 中 ， 我 们 将 采用 后 一 种 方法 。 你 可 以 在 家 中 或 实验 室 中 使 用 桌面 计 
算 机 在 各 种 情况 下 运行 网 络 应 用 程序 。 在 你 的 计算 机 上 观察 网 络 协议 ， 它 是 如 何 与 在 因特网 别处 执行 的 
协议 实体 交互 和 交换 报 文 的 。 因 此 ， 你 与 你 的 计算 机 将 是 这 些 真实 实验 的 有 机 组 成 部 分 。 你 将 通过 动手 
来 观察 和 学 习 。 

用 来 观察 执行 协议 实体 之 间 交 换 的 报 文 的 基本 工具 称 为 分 组 嗅 探 器 (packet sniffer) 。 顾 名 思 义 ， 一 
个 分 组 嗅 探 器 被 动 地 拷贝 RR) 由 你 的 计算 机 发 送 和 接收 的 报 文 ; 它 也 能 显示 出 这 些 被 捕获 报 文 的 各 
个 协议 字段 的 内 容 。 图 1-28 中 显示 了 Wireshark 分 组 嗅 探 器 的 屏幕 快照 。Wireshark 是 一 个 运行 在 Win- 
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dows, Linux/Unix 和 Mac 计算 机 上 的 免费 分 组 嗅 探 问 。 贯 穿 全 书 ， 你 将 发 现 Wireshark 实验 能 让 你 探索 在 
该 章 中 学 习 的 一 些 协议 。 在 这 第 一 个 Wireshark 实验 中 ， 你 将 获得 并 安装 一 个 Wireshark 的 副本 ,访问 一 
个 Web 站 点 ， 捕 获 并 检查 在 你 的 Web 浏览 器 和 Web 服务 器 之 间 交 换 的 协议 报 文 。 











捕获 分 组 
的 列表 
`» 
所 选 定 分 Host: gala. cs.umass. edu\r\n i 
组 首部 的 User-agent: Mozilla/5.0 (windows; U; windows NT 6.1; en-US; rv:1.9.2.24) Gecko/20111103 Firefox/3.6.24 (.NET CLR 3.5.30729)\r\n 
accept: text/html ,application/xhtm]+.m] application/xml; q=0.9,*/*;q=0. 8\r\n 
细节 peeraa orip dria 
Accept-Charset: ISO-8859-1,utf-8;q=0.7 ,*;q=0.,7\r\n 
Keep-alive: 115\r\n 
__ Connection: keep-alive\r\n at 
十 六 进 制 
和 ASCII 
格式 的 分 
组 内 容 


图 1-28 一 个 Wireshark 屏幕 快照 (打印 的 Wireshark 屏幕 快照 得 到 了 Wireshark 基金 会 的 许可 ) 


你 能 够 在 Web 站 点 http://www. pearsonhighered. com/cs-resources/ 上 找到 有 关 该 第 一 个 Wireshark 实验 
的 全 部 材料 (包括 如 何 获得 并 安装 Wireshark 的 指导 ) o 


人 物 专访 


Leonard Kleinrock 是 加 州 大 学 洛杉矶 分 校 (UCLA) 的 计算 机 科学 教 
授 。1969 年 ， 他 在 UCLA 的 计算 机 成 为 因特网 的 第 一 个 节点 。1961 年 ， 
他 创造 的 分 组 交换 原理 成 为 因特网 的 支撑 技术 。 他 在 纽约 城市 大 学 (City 
College of New York, CCNY) 获得 电气 工程 学 士 学 位 ， 并 在 麻 省 理工 学 院 
(MIT) 获得 电气 工程 硕士 和 博士 学 位 。 





。 是 什么 使 得 您 决定 专门 研究 网 络 /因特网 技术 的 ? 

HRF 1959 年 在 MIT 读 博 士 时 ， 我 发 现 周围 的 大 多 数 同学 正在 信息 理论 
和 编码 理论 领域 做 研究 。 在 MIT， 那 时 有 伟大 的 研究 者 Claude Shannon， 他 已 
经 开创 这 些 领域 ， 并 且 已 经 解决 了 许多 重要 的 问题 。 留 下 来 的 研究 问题 既 难 又 
不 太 重 要 。 因 此 我 决定 开始 新 的 研究 领域 ， 而 该 领域 其 他 人 还 没有 想到 。 回 想 那 时 在 MIT 我 的 周围 有 许 
多 计算 机 ， 我 很 清楚 很 快 这 些 计算 机 将 有 相互 通信 的 需求 。 在 那 时 ， 却 没有 有 效 的 办 法 来 做 到 这 一 点 ， 
因此 我 决定 研发 能 够 创建 有 效 的 数据 网 络 的 技术 。 

© 您 在 计算 机 产业 的 第 一 份 工作 是 什么 ? 它 使 您 有 哪些 收益 ? 

1951 ~ 1957 Œ, 我 为 了 获得 电子 工程 学 士 学 位 在 CCNY 读 夜 大 。 在 那 段 时 间 里 ， 我 在 一 家 称 为 
Photobell 的 工业 电子 小 公司 工作 ， 先 是 当 技术 员 ， 然 后 当 工程 师 。 在 那里 ， 我 在 它们 的 产品 线 上 引入 了 
数字 技术 。 我 们 主要 使 用 光电 子 设备 来 检测 某 些 物体 (盒子 、 人 等 ) 的 存在 ， 一 种 称 为 双 稳 态 多 频 振 荡 
器 的 电路 的 使 用 正 是 我 们 需要 的 技术 类 型 ， 它 能 将 数字 处 理 引 入 检测 领域 。 这 些 电 路 恰好 是 计算 机 的 基 
本 模块 ， 用 今天 的 话说 就 是 触发 电路 或 交换 器 。 

o 当 您 发 送 第 一 个 主机 到 主机 报 文 (从 UCLA 到 斯 坦 福 研究 院 ) 时 ， 您 心中 想到 了 什么 ? 





Leonard Kleinrock 
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坦率 地 说 ， 我 们 当时 并 没有 想到 那 件 事 的 重要 性 。 我 们 没有 准备 具有 历史 意义 的 豪言壮语 ， 就 像 昔 
日 许多 发 明 家 所 做 的 那样 (UNSER - 莫 尔 斯 的 “上 帝 创 造 了 什么 〈What hath God wrought)”， 亚 历 山 
K + 格 瑞 汉 姆 . 贝尔 的 “Watson 先生 ， 请 来 这 里 ! 我 想见 你 ”， 或 尼 尔 … 阿姆斯特朗 的 “个 人 的 一 小 步 ， 
人 类 的 一 大 步 ") 。 多 么 聪明 的 人 哪 ! 他 们 明白 媒体 和 公众 的 关系 。 我 们 要 做 的 所 有 工作 是 向 斯 坦 福 研 究 
院 的 计算 机 进行 注册 。 当 我 们 键入 “L”， 它 被 正确 收 到 ， 当 我 们 键入 “o” 又 被 正确 收 到 ， 而 当 我 们 键 
入 “g” 则 引起 斯 坦 福 研 究 院 主机 的 崩溃 ! 因此 ， 这 将 我 们 的 报 文 转换 为 最 短 的 ， 也 许 是 最 有 预测 性 的 
报 文 ,“Lo!” 即 为 “ 真 想不到 (Lo and behold)1”。 

那 年 早 些 时 候 ，UCLA 新 闻 稿 引用 我 的 话说 ， 一 旦 该 网 络 建立 并 运行 起 来 ， 将 可 能 从 我 们 的 家 中 和 
办 公 室 访问 计算 机 设施 ， 就 像 我 们 获得 电力 和 电话 连接 那样 容易 。 因 此 那 时 我 的 美好 愿望 是 ， 因 特 网 将 
是 一 个 无 所 不 在 的 、 总 是 运行 的 、 总 是 可 用 的 网 络 ， 任 何人 从 任何 地 方 用 任何 设备 将 能 够 与 之 相连 ， 并 
且 它 将 是 不 可 见 的 。 然 而 ， 我 从 没有 期 待 我 的 99 岁 的 母亲 将 能 够 上 因特网 ， 但 她 的 确 做 到 了 这 一 点 。 

© 您 对 未 来 网 络 的 展望 是 什么 ? 

我 的 展望 中 最 容易 的 部 分 是 预测 基础 设施 本 身 。 我 预见 我 们 看 到 移动 计算 、 移 动 设备 和 智能 空间 的 
大 量 部 署 。 轻 量 级 、 廉 价 、 高 性 能 、 便 携 的 计算 和 通信 设备 (加 上 因特网 的 无 处 不 在 ) 的 确 使 我 们 成 为 
游牧 一 员 。 游 牧 计算 是 指使 从 一 个 地 方 旅行 到 另 一 个 地 方 的 端 用 户 ， 以 透明 方式 访问 因特网 服务 ， 无论 
他 们 旅行 到 何 处 ， 无论 他 们 携带 什么 设备 或 获得 何 种 接 入 。 展 望 中 最 困难 的 部 分 是 预测 应 用 和 服务 ， 它 
们 以 引 人 注 目的 方式 不 断 地 带 给 我 们 惊喜 (电子 邮件 、 搜 索 技 术 、 万 维 网 、 博 客 、 社 交 网 络 、 用 户 一 代 
以 及 音乐 、 照 片 和 视频 等 的 共享 ) 。 我 们 正面 临 一 种 新 的 惊奇 和 创新 ， 即 移动 应 用 装载 于 手持 设备 中 。 

下 一 步 将 使 我 们 从 信息 空间 虚拟 世界 〈netherworld) 移动 到 智能 空间 的 物理 世界 。 我 们 的 环境 (办 
公 桌 、 墙 壁 、 车 辆 、 钟 表 、 腰 带 等 ) 将 因 技 术 而 棚 棚 如 生 ， 这 些 技术 包括 执行 器 (actuator), ERAR, 
逻辑 、 处 理 、 存 储 、 照 相机 、 麦 克 风 、 话 简 、 显 示 器 和 通信 。 这 种 散人 式 技术 将 使 得 环境 能 提供 我 们 需 
要 的 IP 服务 。 当 我 走 进 一 间 房间 时 ， 该 房间 知道 我 的 到 来 。 我 将 能 够 与 环境 自然 地 通信 ， 如 同 说 英语 一 
FE; 我 的 请 求 产 生 的 响应 将 从 墙 上 的 显示 上 器 通过 我 的 眼镜 以 Web 网 页 的 形式 呈现 给 我 ， 就 像 说 话 、 全 息 
照相 等 一 样 。 

再 向 前 看 一 点 ， 我 看 到 未 来 的 网 络 包括 了 下 列 附 加 的 关键 组 件 。 我 看 到 在 网 络 各 处 部 署 的 智能 软件 
代理 ， 它 的 功能 是 挖掘 数据 ， 根 据 数据 采取 动作 ， 观 察 趋势 ， 并 能 动态 地 、 自 适应 地 执行 任务 。 我 看 到 
相当 多 的 网 络 流量 并 不 是 由 人 产生 的 ， 而 是 由 这 些 舱 入 式 设备 和 这 些 智能 软件 代理 产生 的 。 我 看 到 大 批 
的 自 组 织 系 统 控 制 这 个 巨大 、 快 速 的 网 络 。 我 看 到 巨 量 的 信息 瞬间 通过 网 络 立 即 得 到 强力 处 理 和 过 滤 。 
因特网 最 终 将 是 一 个 无 所 不 在 的 全 球 性 神经 系统 。 当 我 们 急速 在 21 世纪 进发 时 ， 我 将 看 到 这 些 东 西 和 更 
多 的 东西 。 

。 是 谁 激发 了 您 的 职业 灵感 ? 

到 目前 为 止 ， 是 麻 省 理工 学 院 的 Claude Shannon。 他 是 一 名 早 越 的 研究 者 ， 具 有 以 高 度 直觉 的 方式 将 
他 的 数学 理念 与 物理 世界 关联 起 来 的 能 力 。 他 是 我 的 博士 论文 答辩 委员 会 的 成 员 。 

o 您 对 进入 网 络 / 因 特 网 领域 的 学 生 有 什么 忠告 吗 ? 

因特网 和 由 它 使 能 的 所 有 东西 是 一 个 巨大 的 新 前 沿 ， 充 满 了 令 人 惊奇 的 挑战 ， 为 众多 创新 提供 了 广 
阔 空 间 。 不 要 受 今天 技术 的 束缚 ， 开 动 大 脑 ， 想 象 能 够 做 些 什 么 ， 并 去 实现 它 。 
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网 络 应 用 是 计算 机 网 络 存在 的 理由 ， 如 果 我 们 不 能 构想 出 任何 有 用 的 应 用 ， 也 就 没有 
任何 必要 去 设计 支持 它们 的 网 络 协 议 了 。 自 因特网 全 面 发展 以 来 ， dad 
的 、 有 趣 的 网 络 应 用 。 这 些 应 用 程序 已 经 成 为 因特网 成 功 的 驱动 力 ， 激 励 人 们 在 家 庭 、 
校 、 政 府 和 商业 中 利用 网 络 ， 使 因特网 成 为 他 们 日 常 活动 的 密 不 可 分 的 一 部 分 。 

因特网 应 用 包括 : 20 世纪 70 年 代 和 80 年 代 开 始 流行 的 经 典 的 基于 文本 的 应 用 ， 如 文 
本 电子 邮件 、 远 程 访 问 计 算 机 、 文 件 传输 和 新 闻 组 ; 20 世纪 90 年 代 中 期 引入 的 招 人 喜爱 
的 应 用 一 一 万 维 网 ， 包 括 Web 冲浪 、 搜 索 和 电子 商务 ; 20 世纪 末 引 入 的 两 个 招 人 喜爱 的 
应 用 一 一 即时 讯息 和 对 等 (P2P) 文件 共享 。 自 2000 年 以 来 ,新 型 和 极其 引人入胜 的 应 用 
持续 出 现 ， 包 括 : IP Ei (VoIP), WHEN (如 Skype, Facetime 和 Google Hangouts ) ; 
用 户 生 成 的 视频 (如 YouTube) 和 点 播 电 影 (UN Netflix); 多 方 在 线 游戏 (如 《第 二 人 生 》 
(Second Life) 和 《魔兽 世界 》( World of Warcraft) ) 。 在 这 段 时 期 ， 我 们 看 到 了 新 一 代 社 
交 网 络 应 用 ， 如 Facebook, Instagram, Twitter 和 微 信 ， 它 们 在 因特网 的 网 络 或 路 由 器 和 通 
信和 链 路 之 上 创建 了 引人入胜 的 人 类 网 络 。 近 年 来 ， 随 着 智能 手机 的 发 展 ， 出 现 了 大 量 基 于 
位 置 的 移动 应 用 程序 ， 包 括 流行 的 签到 、 约 会 和 道路 流量 预测 应 用 (如 Yelp, Tinder, 
Waz 和 Yik Yak ) 。 显 然 ， 新 型 和 令 人 兴奋 的 因特网 应 用 的 步伐 并 没有 减缓 。 也 许 本 书 的 一 
些 读者 将 会 创建 下 一 代 招 人 喜爱 的 因特网 应 用 。 

在 本 章 中 ， 我 们 学 习 有 关 网 络 应 用 的 原理 和 实现 方面 的 知识 。 我 们 从 定义 关键 的 应 用 
层 概 念 开始 ， 其 中 包括 应 用 程序 所 需要 的 网 络 服务 、 客 户 和 服务 器 、 进 程 和 运输 层 接 口 。 
我 们 详细 考察 几 种 网 络 应 用 程序 ， 包 括 Web、 电 子 邮件 、DNS 、 对 等 文件 分 发 和 视频 流 
(第 9 章 关 注 多 媒体 应 用 ， 包 括 流 式 视频 和 VoIP)。 然 后 我 们 将 涉及 开发 运行 在 TCP 和 
UDP 上 的 网 络 应 用 程序 。 特 别 是 ， 我 们 学 习 套 接 字 接口 ， 并 浮光掠影 地 学 习 用 Python if 
言 写 的 一 些 简 单 的 客户 - 服务 器 应 用 程序 。 在 本 章 结尾 ， 我 们 也 将 提供 几 个 有 趣 、 有 意思 
的 套 接 字 编 程 作 业 。 

应 用 层 是 我 们 学 习 协 议 非 常 好 的 起 点 ， 它 最 为 我 们 所 熟悉 。 我 们 熟悉 的 很 多 应 用 就 是 
建立 在 这 些 将 要 学 习 的 协议 基础 上 的 。 通 过 对 应 用 层 的 学 习 ， 将 有 助 于 我 们 很 好 地 感受 到 
协议 的 方方面面 ， 将 使 我 们 了 解 到 很 多 问题 ， 这 些 问 题 在 我 们 学 习 运 输 层 、 网 络 层 及 数据 
链 路 层 协议 时 也 同样 会 碰 到 。 


2.1 应 用 层 协 议 原 理 


假定 你 对 新 型 网 络 应 用 有 了 一 些 想法 。 也 许 这 种 应 用 将 为 人 类 提供 一 种 伟大 的 服务 ， 
或 者 将 使 你 的 教授 高 兴 ， 或 者 将 带 给 你 大 量 的 财富 ， 或 者 只 是 在 开发 中 获得 乐趣 。 无 论 你 
的 动机 是 什么 ， 我 们 现在 考察 一 下 如 何 将 你 的 想法 转变 为 一 种 真实 世界 的 网 络 应 用 。 

研发 网 络 应 用 程序 的 核心 是 写 出 能 够 运行 在 不 同 的 端 系统 和 通过 网 络 彼此 通信 的 程序 。 
例如 ， 在 Web 应 用 程序 中 ， 有 两 个 互相 通信 的 不 同 的 程序 : 一 个 是 运行 在 用 户主 机 (R 
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机 、 膝 上 机 、 平 板 电脑 、 智 能 电话 等 ) 上 的 浏览 器 程序 ; 另 一 个 是 运行 在 Web FR at EBL 
上 的 Web 服务 器 程序 。 另 一 个 例子 是 PP 文件 共享 系统 ， 在 参与 文件 共享 的 社区 中 的 每 台 
主机 中 都 有 一 个 程序 。 在 这 种 情况 下 ， 在 各 台 主 机 中 的 这 些 程序 可 能 都 是 类 似 的 或 相同 的 。 

因此 ， 当 研发 新 应 用 程序 时 ， 你 需要 编写 将 在 多 台 端 系统 上 运行 的 软件 。 该 软件 能 够 用 
如 C、Java 或 Python 来 编写 。 重 要 的 是 ， 你 不 需要 写 在 网 络 核心 设备 如 路 由 需 或 链 路 层 交 换 
机 上 运行 的 软件 。 即 使 你 要 为 网 络 核心 设备 写 应 用 程序 软件 ， 你 也 不 能 做 到 这 一 点 。 如 我 们 
在 第 1 章 所 知 ， 以 及 如 图 1-24 所 显示 的 那样 ， 网 络 核心 设备 并 不 在 应 用 层 上 起 作用 ， 而 仅 在 
较 低 层 起 作用 ， 特 别 是 在 网 络 层 及 下 面 层次 起 作用 。 这 种 基本 设计 ， 即 将 应 用 软件 限制 在 端 
系统 (如 图 2-1 所 示 ) 的 方法 ， 促 进 了 大 量 的 网 络 应 用 程序 的 迅速 研发 和 部 署 。 





图 2-1 在 应 用 层 的 端 系统 之 间 的 网 络 应 用 的 通信 


2.1.1 网 络 应 用 程序 体系 结构 


当 进行 软件 编码 之 前 ， 应 当 对 应 用 程序 有 一 个 宽泛 的 体系 结构 计划 。 记 住 应 用 程序 的 
体系 结构 明显 不 同 于 网 络 的 体系 结构 (例如 在 第 1 章 中 所 讨论 的 5 层 因特网 体系 结构 ) 。 
从 应 用 程序 研发 者 的 角度 看 ， 网 络 体系 结构 是 固定 的 ， 并 为 应 用 程序 提供 了 特定 的 服务 集 


合 。 在 另 一 方面 ， 应 用 程序 体系 结构 (application architecture) 由 应 用 程序 研发 者 设计 ， 
规定 了 如 何在 各 种 端 系 统 上 组 织 该 应 用 程序 。 在 选择 应 用 程序 体系 结构 时 ， 应 用 程序 研发 
者 很 可 能 利用 现代 网 络 应 用 程序 中 所 使 用 的 两 种 主流 体系 结构 之 一 : 客户 -服务 器 体系 结 
构 或 对 等 (P2P) 体系 结构 。 

在 客户 -服务 器 体系 结构 (client-server architecture) 中 ， 有 一 个 总 是 打开 的 主机 称 为 
服务 器 ， 它 服务 于 来 自 许 多 其 他 称 为 客户 的 主机 的 请 求 。 一 个 典型 的 例子 是 Web 应 用 程 
序 ， 其 中 总 是 打开 的 Web 服务 器 服务 于 来 自 浏览 器 (运行 在 客户 主机 上 ) 的 请 求 。 当 
Web 服务 器 接收 到 来 自 某 客户 对 某 对 象 的 请 求 时 ， 它 回 该 客户 发 送 所 请 求 的 对 象 作 为 响 
应 。 值 得 注意 的 是 利用 客户 - 服务 器 体系 结构 ， 客 户 相互 之 间 不 直接 通信 ; 例如 ， 在 Web 
应 用 中 两 个 浏览 器 并 不 直接 通信 。 客 户 -服务 器 体系 结构 的 男 一 个 特征 是 该 服务 器 具有 固 
定 的 、 周 知 的 地 址 ， 该 地 址 称 为 P Hott 〈 我 们 将 很 快 讨 论 它 ) 。 因 为 该 服务 器 具有 固定 
的 、 周 知 的 地 址 ， 并 且 因 为 该 服务 器 总 是 打开 的 ， 客 户 总 是 能 够 通过 回 该 服务 器 的 IP 地 
址 发 送 分 组 来 与 其 联系 。 具 有 客户 -服务 器 体系 结构 的 非常 著名 的 应 用 程序 包括 Web, 
FTP, Telnet 和 电子 邮件 。 图 2-2a 中 显示 了 这 种 客户 - 服务 器 体系 结构 。 





a) 客户 -服务 器 体系 结构 b) P2P 体 系 结构 
图 2-2 客户 -服务 器 体系 结构 及 P2P 体系 结构 


在 一 个 客户 -服务 器 应 用 中 ， 常 常会 出 现 一 台 单独 的 服务 器 主机 跟 不 上 它 所 有 客户 请 
求 的 情况 。 例 如 ， 一 个 流行 的 社交 网 络 站 点 如 果 仅 有 一 台 服 务 器 来 处 理 所 有 请 求 ， 将 很 快 
变 得 不 堪 重 负 。 为 此 ， 配 备 大 量 主机 的 数据 中 心 (data center) 常 被 用 于 创建 强大 的 虚拟 
服务 器 。 最 为 流行 的 因特网 服务 一 一 如 搜索 引擎 (MAM, Bing 和 百度 ) 、 因 特 网 商务 
(Qn Si, e-Bay 和 阿里 巴巴 ) 、 基 于 Web 的 电子 邮件 (如 Gmail 和 雅虎 邮件 )、 社 交 网 
络 ( 如 脸 书 、Instagram、 推 特 和 微 信 )， 就 应 用 了 一 个 或 多 个 数据 中 心 。 如 在 1.3.3 节 中 
所 讨论 的 那样 ， 谷 歌 有 分 布 于 全 世界 的 30 ~50 个 数据 中 心 ， 这 些 数据 中 心 共同 处 理 搜索 、 
YouTube, Gmail 和 其 他 服务 。 一 个 数据 中 心 能 够 有 数 十 万 台 服 务 器 ， 它 们 必须 要 供电 和 维 
护 。 此 外 ， 服 务 提 供 商 必须 支付 不 断 出 现 的 互联 和 带宽 费用 ， 以 发 送 和 接收 到 达 / 来 自 数 
据 中 心 的 数据 。 
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在 一 个 P2P 体系 结构 (P2P architecture) H, MAL PRADA Se ARS AeA Be) 
(或 者 没有 ) 依赖 。 相 反 ， 应 用 程序 在 间断 连接 的 主机 对 之 间 使 用 直接 通信 ， 这 些 主机 对 
被 称 为 对 等 方 。 这 些 对 等 方 并 不 为 服务 提供 商 所 有 ， 相 反 却 为 用 户 控 制 的 介面 机 和 膝 上 机 
所 有 ， 大 多 数 对 等 方 驻 留 在 家 庭 、 大 学 和 办 公 室 。 因 为 这 种 对 等 方 通信 不 必 通 过 专门 的 服 
务 器 ， 该 体系 结构 被 称 为 对 等 方 到 对 等 方 的 。 许 多 目前 流行 的 、 流 量 密集 型 应 用 都 是 P2P 
体系 结构 的 。 这 些 应 用 包括 文件 共享 (例如 BitTorrent) 、 对 等 方 协 助 下 载 加 速 器 (例如 迅 
雷 ) 、 因 特 网 电话 和 视频 会 议 (例如 Skype)。 图 2-2b 中 显示 了 P2P 的 体系 结构 。 需 要 所 
及 的 是 ， 某 些 应 用 具有 混合 的 体系 结构 ， 它 结合 了 客户 - 服务 器 和 P2P RIR. PIM, X 
于 许多 即时 讯息 应 用 而 言 ， 服 务 侨 被 用 于 跟 踊 用 户 的 IP 地址 ,但 用 户 到 用 户 的 报 文 在 用 
户主 机 之 间 (cH PAAR a) 直接 发 送 。 

P2P 体系 结构 的 最 引人入胜 的 特性 之 一 是 它们 的 自 扩展 性 (self- scalability) 。 例 如 ， 
在 一 个 P2P 文件 共享 应 用 中 ， 尽 管 每 个 对 等 方 都 由 于 请 求 文件 产生 工作 负载 ,但 每 个 对 等 
方 通过 向 其 他 对 等 方 分 发 文件 也 为 系统 增加 服务 能 力 。P2P 体系 结构 也 是 有 成 本 效率 的 ， 
因为 它们 通常 不 需要 庞大 的 服务 器 基础 设施 和 服务 器 带宽 (这 与 具有 数据 中 心 的 客户 - 服 
务 器 设计 形成 鲜明 对 比 ) 。 然 而 ， 未 来 P2P 应 用 由 于 高 度 非 集中 式 结构 ， 面 临安 全 性 、 性 
能 和 可 靠 性 等 挑战 。 


2.1.2 进程 通信 


在 构建 网 络 应 用 程序 前 ， 还 需要 对 运行 在 多 个 端 系 统 上 的 程序 是 如 何 互 相通 信 的 情况 
有 一 个 基本 了 解 。 用 操作 系统 的 术语 来 说 ， 进 行 通信 的 实际 上 是 进程 (process) 而 不 是 程 
序 。 一 个 进程 可 以 被 认为 是 运行 在 端 系 统 中 的 一 个 程序 。 当 多 个 进程 运行 在 相同 的 端 系统 
上 时 ， 它 们 使 用 进程 间 通 信 机 制 相互 通信 。 进 程 间 通信 的 规则 由 端 系统 上 的 操作 系统 确 
定 。 而 在 本 书 中 ， 我 们 并 不 特别 关注 同一 台 主 机 上 的 进程 间 的 通信 ， 而 关注 运行 在 不 同 端 
系统 〈 可 能 具有 不 同 的 操作 系统 ) 上 的 进程 间 的 通信 。 

在 两 个 不 同 端 系统 上 的 进程 ， 通 过 跨越 计算 机 网 络 交换 报 文 (message) 而 相互 通信 。 
发 送 进程 生成 并 向 网 络 中 发 送 报 文 ; 接收 进程 接收 这 些 报 文 并 可 能 通过 回 送 报 文 进行 啊 
应 。 图 2-1 显示 了 驻 留 在 5 层 协议 栈 的 应 用 层 进程 互相 通信 的 情况 。 

1. 客户 和 服务 红 进 程 

网 络 应 用 程序 由 成 对 的 进程 组 成 ， 这 些 进 程 通过 网 络 相互 发 送 报 文 。 例 如 ， 在 Web 
应 用 程序 中 ， 一 个 客户 浏览 器 进程 与 一 台 Web 服务 器 进程 交换 报 文 。 在 一 个 P2P 文件 共 
享 系统 中 ， 文 件 从 一 个 对 等 方 中 的 进程 传输 到 另 一 个 对 等 方 中 的 进程 。 对 每 对 通信 进程 ， 
我 们 通常 将 这 两 个 进程 之 一 标识 为 客户 (client)， 而 男 一 个 进程 标识 为 服务 器 (server), 
对 于 Web 而 言 ， 浏 览 器 是 一 个 客户 进程 ，Web 服务 器 是 一 台 服 务 器 进程 。 对 于 P2P 文件 
共享 ， 下载 文 件 的 对 等 方 标识 为 客户 ， 上 载 文 件 的 对 等 方 标识 为 服务 器 。 

你 或 许 已 经 观察 到 ， 如 在 P2P 文件 共享 的 某 些 应 用 中 ， 一 个 进程 能 够 既是 客户 又 是 服 
务 器 。 在 P2P 文件 共享 系统 中 ， 一 个 进程 的 确 既 能 上 载 文 件 又 能 下 载 文件 。 无 论 如 何 ， 在 
任何 给 定 的 一 对 进程 之 间 的 通信 会 话 场景 中 ， 我 们 仍 能 将 一 个 进程 标识 为 客户 ， 为 一 个 进 
程 标识 为 服务 器 。 我 们 定义 客户 和 服务 器 进程 如 下 : 

在 一 对 进程 之 间 的 通信 会 话 场景 中 ， 发 起 通信 ( 即 在 该 会 话 开 始 时 发 起 与 其 

他 进程 的 联系 ) 的 进程 被 标识 为 客户 ， 在 会 话 开始 时 等 待 联系 的 进程 是 服务 器 。 
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在 Web 中 ， 一 个 浏览 器 进程 加 一 台 Web 服务 器 进程 发 起 联系 ， 因 此 该 浏览 器 进程 是 
客户 ， 而 该 Web 服务 器 进程 是 服务 器 。 在 P2P 文件 共享 中 ， 当 对 等 方 A 请 求 对 等 方 B 发 
送 一 个 特定 的 文件 时 ， 在 这 个 特定 的 通信 会 话 中 对 等 方 A 是 客户 ， 而 对 等 方 B 是 服务 器 。 
在 不 致 混淆 的 情况 下 ， 我 们 有 时 也 使 用 术语 “应 用 程序 的 客户 端 和 服务 器 闪 " 。 在 本 章 的 
结尾 ， 我 们 将 逐步 讲解 网 络 应 用 程序 的 客户 端 和 服务 器 端的 简单 代码 。 

2. 进程 与 计算 机 网 络 之 间 的 接口 

如 上 所 述 ， 多 数 应 用 程序 是 由 通信 进程 对 组 成 ， 每 对 中 的 两 个 进程 互相 发 送 报 文 。 从 
一 个 进程 向 另 一 个 进程 发 送 的 报 文 必须 通过 下 面 的 网 络 。 进 程 通过 一 个 称 为 套 接 字 (sock- 
et) 的 软件 接口 向 网 络 发 送 报 文 和 从 网 络 接收 报 文 。 我 们 考虑 一 个 类 比 来 帮助 我 们 理解 进 
程 和 套 接 字 。 进 程 可 类 比 于 一 座 房子 ， 而 它 的 套 接 字 可 以 类 比 于 它 的 门 。 当 一 个 进程 想 回 
位 于 另外 一 台 主 机 上 的 另 一 个 进程 发 送 报 文 时 ， 它 把 报 文 推出 该 门 (BRS). BRE 
程 假定 该 门 到 另外 一 侧 之 间 有 运输 的 基础 设施 ， 该 设施 将 把 报 文 传送 到 目的 进程 的 门口 。 
一 且 该 报 文 抵达 目的 主机 ， 它 通过 接收 进程 的 门 〈 套 接 字 ) 传递 ， 然 后 接收 进程 对 该 报 文 
进行 处 理 。 

图 2-3 显示 了 两 个 经 过 因特网 通信 的 进程 之 间 的 套 接 字 通信 (图 2-3 中 假定 由 该 进程 
使 用 的 下 面 运输 层 协议 是 因特网 的 TCP 协议 ) 。 如 该 图 所 示 ， 套 接 字 是 同一 台 主 机 内 应 用 
层 与 运输 层 之 间 的 接口 。 由 于 该 套 接 字 是 建立 网 络 应 用 程序 的 可 编程 接口 ， 因 此 套 接 字 也 
称 为 应 用 程序 和 网 络 之 间 的 应 用 程序 编程 接口 (Application Programming Interface, API) 。 
应 用 程序 开发 者 可 以 控制 套 接 字 在 应 用 层 端的 一 切 ， 但 是 对 该 套 接 字 的 运输 层 端 几乎 没有 
控制 权 。 应 用 程序 开发 者 对 于 运输 层 的 控制 仅 限 于 : 选择 运输 层 协 议 ; @ 也 许 能 设 定 几 
个 运输 层 参 数 ， 如 最 大 缓存 和 最 大 报 文 段 长 度 等 (将 在 第 3 章 中 涉及 )。 一 旦 应 用 程序 开 
发 者 选择 了 一 个 运输 层 协 议 (如 果 可 供 选 择 的 话 ) ， 则 应 用 程序 就 建立 在 由 该 协议 提供 的 
运输 层 服务 之 上 。 我 们 将 在 2.7 节 中 对 套 接 字 进行 更 为 详细 的 探讨 。 

3. 进程 寻 址 

为 了 回 特 定 目的 地 发 送 邮政 邮件 ， 目 的 地 需要 有 一 个 地 址 。 类 似 地 ， 在 一 台 主 机 上 运 
行 的 进程 为 了 向 在 另 一 台 主 机 上 运行 的 进程 发 送 分 组 ， 接 收 进程 需要 有 一 个 地 址 。 为 了 标 
识 该 接收 进程 ， 需 要 定义 两 种 信息 : 中 主机 的 地 址 ; 四 在 目的 主机 中 指定 接收 进程 的 标 
识 符 。 


主机 或 服务 器 主机 或 服务 器 
$ 


+ 
具有 缓存 、 
变量 的 TCP 


图 2-3 应 用 进程 、 套 接 字 和 下 面 的 运输 层 协议 
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在 因特网 中 ， 主 机 由 其 IP 地址 (IP address) 标识 。 我 们 将 在 第 4 章 中 非常 详细 地 讨 
论 IP 地 址 。 此 时 ， 我们 只 要 知道 IP 地 址 是 一 个 32 比特 的 量 且 它 能 够 唯一 地 标识 该 主机 就 
够 了 。 除 了 知道 报 文 发 送 目的 地 的 主机 地 址 外 ， 发 送 进程 还 必须 指定 运行 在 接收 主机 上 的 
接收 进程 〈 更 具体 地 说 ， 接 收 套 接 字 ) 。 因 为 一 般 而 言 一 台 主 机 能 够 运行 许多 网 络 应 用 ， 
这 些 信息 是 需要 的 。 目 的 地 端口 号 (port number) 用 于 这 个 目的 。 已 经 给 流行 的 应 用 分 配 
了 特定 的 端口 号 。 例 如 ，Web 服务 器 用 端口 号 80 来 标识 。 邮 件 服务 器 进程 〈 使 用 SMTP 
协议 ) 用 端口 号 25 来 标识 。 用 于 所 有 因特网 标准 协议 的 周知 端口 号 的 列表 能 够 在 http : // 
www. iana. org 处 找到 。 我 们 将 在 第 3 章 中 详细 学 习 端 口号 。 


2.1.3 可 供应 用 程序 使 用 的 运输 服务 


前 面 讲 过 套 接 字 是 应 用 程序 进程 和 运输 层 协议 之 间 的 接口 。 在 发 送 端的 应 用 程序 将 报 
文 推进 该 套 接 字 。 在 该 套 接 字 的 另 一 侧 ， 运 输 层 协议 负责 从 接收 进程 的 套 接 字 得 到 该 
报 文 。 

包括 因特网 在 内 的 很 多 网 络 提供 了 不 止 一 种 运输 层 协议 。 当 开发 一 个 应 用 时 ， 必 须 选 
择 一 种 可 用 的 运输 层 协议 。 如 何 做 出 这 种 选择 呢 ? 最 可 能 的 方式 是 ， 通 过 研究 这 些 可 用 的 
运输 层 协 议 所 提供 的 服务 ， 选 择 一 个 最 能 为 你 的 应 用 需求 提供 恰当 服务 的 协议 。 这 种 情况 
类 似 于 在 两 个 城市 间 旅 行 时 选择 飞机 还 是 火车 作为 交通 工具 。 每 种 运输 模式 为 你 提供 不 同 
的 服务 ， 你 必须 选择 一 种 或 另 一 种 〈 例 如 ， 火 车 可 以 直到 市 区 上 客 和 下 客 ， 而 飞机 提供 了 
更 短 的 旅行 时 间 ) 。 

一 个 运输 层 协议 能 够 为 调用 它 的 应 用 程序 提供 什么 样 的 服务 呢 ? 我 们 大 体能 够 从 四 个 
方面 对 应 用 程序 服务 要 求 进行 分 类 : 可 靠 数据 传输 、 吞 吐 量 、 定 时 和 安全 性 。 

1， 可 靠 数 据 传输 


如 第 1 章 讨论 的 那样 ， 分 组 在 计算 机 网 络 中 可 能 丢失 。 例 如 ， 分 组 能 够 使 路 由 顺 中 的 
缓存 溢出， 或 者 当 分 组 中 的 某 些 比特 损坏 后 可 能 被 丢弃 。 像 电子 邮件 、 文 件 传 输 、 远 程 主 
机 访问 、Web 文档 传输 以 及 金融 应 用 等 这 样 的 应 用 ， 数 据 丢 失 可 能 会 造成 灾难 性 的 后 果 
(在 后 一 种 情况 下 ， 无 论 对 银行 或 对 顾客 都 是 如 此 !) 。 因 此 ， 为 了 支持 这 些 应 用 ， 必 须 做 
一 些 工作 以 确保 由 应 用 程序 的 一 端 发 送 的 数据 正确 、 完 全 地 交付 给 该 应 用 程序 的 另 一 端 。 
如 果 一 个 协议 提供 了 这 样 的 确保 数据 交付 服务 ， 就 认为 提供 了 可 靠 数 据 传输 (reliable data 
transfer) 。 运 输 层 协议 能 够 潜在 地 向 应 用 程序 提供 的 一 个 重要 服务 是 进程 到 进程 的 可 靠 数 
据 传输 。 当 一 个 运输 协议 提供 这 种 服务 时 ， 发 送 进程 只 要 将 其 数据 传递 进 套 接 字 ， 就 可 以 
完全 相信 该 数据 将 能 无 差错 地 到 达 接 收 进程 。 

当 一 个 运输 层 协议 不 提供 可 靠 数据 传输 时 ， 由 发 送 进程 发 送 的 某 些 数 据 可 能 到 达 不 了 
接收 进程 。 这 可 能 能 被 容忍 丢失 的 应 用 (loss-tolerant application) 所 接受 ， 最 值得 注意 的 
是 多 媒体 应 用 ， 如 交谈 式 音 频 /视频 ， 它 们 能 够 承受 一 定量 的 数据 丢失 。 在 这 些 多 媒体 应 
用 中 ， 丢 失 的 数据 引起 播放 的 音频 /视频 出 现 小 干扰 ， 而 不 是 致命 的 损伤 。 

2. mii 


在 第 1 章 中 我 们 引入 了 可 用 吞吐 量 的 概念 ， 在 沿 着 一 条 网 络 路 径 上 的 两 个 进程 之 间 的 
通信 会 话 场 景 中 ， 可 用 否 吐 量 就 是 发 送 进 程 能 够 向 接收 进程 交付 比特 的 速率 。 因 为 其 他 会 
话 将 共享 沿 着 该 网 络 路 径 的 带宽 ， 并且 因 为 这 些 会 话 将 会 到 达 和 离开 ,该 可 用 吞吐 量 将 随 
时 间 波 动 。 这 些 观察 导致 男 一 种 自然 的 服务 ， 即 运输 层 协议 能 够 以 某 种 特定 的 速率 提供 确 
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保 的 可 用 吞吐 量 。 使 用 这 种 服务 ， 该 应 用 程序 能 够 请 求 r 比特 / 秒 的 确保 吞吐 量 ， 并 且 该 
运输 协议 能 够 确保 可 用 吞吐 量 总 是 为 至 少 r 比特 / 秒 。 这 样 的 确保 吞吐 量 的 服务 将 对 许多 
应 用 程序 有 吸引 力 。 人 例如， 如果 因 特 网 电话 应 用 程序 对 语音 以 32kbps 的 速率 进行 编码 ， 
那么 它 需要 以 这 个 速率 向 网 络 发 送 数据 ， 并 以 该 速率 向 接收 应 用 程序 交付 数据 。 如 果 运 输 
协议 不 能 提供 这 种 吞吐 量 ， 该 应 用 程序 或 以 较 低 速率 进行 编码 (并 且 接 收 足 够 的 吞吐 量 以 
维持 这 种 较 低 的 编码 速率 ) ， 或 它 可 能 必须 放弃 发 送 ， 这 是 因为 对 于 这 种 因特网 电话 应 用 
而 言 ， 接 收 所 需 吞 吐 量 的 一 半 是 几乎 没有 或 根本 没有 用 处 的 。 具 有 吞吐 量 要 求 的 应 用 程序 
被 称 为 融 宽 敏感 的 应 用 (bandwidth- sensitive application) 。 许 多 当前 的 多 媒体 应 用 是 带宽 敏 
感 的 ， 尽 管 某 些 多 媒体 应 用 程序 可 能 采用 自 适 应 编码 技术 对 数字 语音 或 视频 以 与 当前 可 用 
带宽 相 匹 配 的 速率 进行 编码 。 

带宽 敏感 的 应 用 具有 特定 的 吞吐 量 要 求 ， 而 弹性 应 用 (elastic application) 能 够 根据 
当时 可 用 的 带宽 或 多 或 少 地 利用 可 供 使 用 的 吞吐 量 。 电 子 邮件 、 文 件 传 输 以 及 Web 传送 
都 属于 弹性 应 用 。 当 然 ， 吞 吐 量 是 越 多 越 好 。 有 一 句 格 言说 得 好 ， 钱 越 多 越 好 ， 人 越 瘦 越 
美 ， 我 们 永远 不 会 嫌 吞 吐 量 太 多 的 ! 

3. 定时 

运输 层 协议 也 能 提供 定时 保证 。 如 同 具有 吞吐 量 保证 那样 ， 定 时 保证 能 够 以 多 种 形式 
实现 。 一 个 保证 的 例子 如 : 发 送 方 注 入 进 套 接 字 中 的 每 个 比特 到 达 接 收 方 的 套 接 字 不 迟 于 
100ms。 这 种 服务 将 对 交互 式 实时 应 用 程序 有 吸引 力 ， 如 因特网 电话 、 虚 拟 环境 、 电 话 会 
议和 多 方 游戏 ， 所 有 这 些 服 务 为 了 有 效 性 而 要 求 数 据 交 付 有 严格 的 时 间 限 制 (参见 第 9 章 
[ Gauthier 1999; Ramjee 1994 ] ) 。 例 如 ， 在 因特网 电话 中 ， 较 长 的 时 延 会 导致 会 话 中 出 现 
不 自然 的 停顿 ; 在 多 方 游戏 和 虚拟 互动 环境 中 ， 在 做 出 动作 并 看 到 来 自 环境 (如 来 自 位 于 
端 到 端 连接 中 另 一 端点 的 玩家 ) 的 啊 应 之 间 ， 较 长 的 时 延 使 得 它 失 去 真实 感 。 对 于 非 实时 
的 应 用 ， 较 低 的 时 延 总 比较 高 的 时 延 好 ， 但 对 端 到 端的 时 延 没 有 严格 的 约束 。 

4. 安全 性 


最 后 ， 运 输 协议 能 够 为 应 用 程序 提供 一 种 或 多 种 安全 性 服务 。 例 如 ， 在 发 送 主机 
中 ， 运 输 协 议 能 够 加 密 由 发 送 进程 传输 的 所 有 数据 ， 在 接收 主机 中 ， 运 输 层 协议 能 够 在 
将 数据 交付 给 接收 进程 之 前 解密 这 些 数据 。 这 种 服务 将 在 发 送 和 接收 进程 之 间 提 供 机 密 
性 ， 以 防 该 数据 以 某 种 方式 在 这 两 个 进程 之 间 被 观察 到 。 运 输 协议 还 能 提供 除了 机 密 性 
以 外 的 其 他 安全 性 服务 ， 包 括 数据 完整 性 和 端点 鉴别 ， 我 们 将 在 第 8 章 中 详细 讨论 这 些 
主题 。 


2. 1.4 因特网 提供 的 运输 服务 


至 此 ， 我 们 已 经 考虑 了 计算 机 网 络 能 够 提供 的 通用 运输 服务 。 现 在 我 们 要 更 为 具体 地 
考察 由 因特网 提供 的 运输 服务 类 型 。 因 特 网 (更 一 般 的 是 TCP/IP 网 络 ) 为 应 用 程序 提供 
两 个 运输 层 协议 ， 即 UDP 和 TCP。 当 你 (作为 一 个 软件 开发 者 ) 为 因特网 创建 一 个 新 的 
应 用 时 ， 前 先 要 做 出 的 决定 是 ， 选 择 UDP 还 是 选择 TCP。 每 个 协议 为 调用 它们 的 应 用 程序 
提供 了 不 同 的 服务 集合 。 图 2-4 显示 了 某 些 所 选 的 应 用 程序 的 服务 要 求 。 

1. TCP 服务 


TCP 服务 模型 包括 面 问 连接 服务 和 可 靠 数据 传输 服务 。 当 某 个 应 用 程序 调用 TCP 作为 
其 运输 协议 时 ， 该 应 用 程序 就 能 获得 来 自 TCP 的 这 两 种 服务 . 
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因特网 电话 /视频 会 议 容忍 是 ，100ms 
视频 视频 (10kbps ~5Mbps) | SMbps) 

流 式 存储 音频 /视频 同上 a O 


‘a 


图 2-4 选择 的 网 络 应 用 的 要 求 


e 面向 连接 的 服务 : 在 应 用 层 数据 报 文 开 始 流动 之 前 ，TCP 让 客户 和 服务 右 互 相交 
换 运输 层 控 制 信息 。 这 个 所 谓 的 握手 过 程 提 醒 客 户 和 服务 器 ， 让 它们 为 大 量 分 组 
的 到 来 做 好 准备 。 在 握手 阶段 后 ， 一 个 TCP 连接 (TCP connection) 就 在 两 个 进 
程 的 套 接 字 之 间 建 立 了 。 这 条 连接 是 全 双 工 的 ， 即 连接 双方 的 进程 可 以 在 此 连接 
上 同时 进行 报 文 收发 。 当 应 用 程序 结束 报 文 发 送 时 ， 必 须 拆除 该 连接 。 在 第 3 章 
中 我 们 将 详细 讨论 面向 连接 的 服务 ， 并 分 析 它 是 如 何 实现 的 。 

© 可 靠 的 数据 传送 服务 : 通信 进程 能 够 依靠 TCP， 无 差错 、 按 适当 顺序 交付 所 有 发 
送 的 数据 。 当 应 用 程序 的 一 端 将 字 节 流传 进 套 接 字 时 ， 它 能 够 依靠 TCP 将 相同 的 
字 节 流 交付 给 接收 方 的 套 接 字 ， 而 没有 字 节 的 丢失 和 元 余 。 

TCP 协议 还 具有 拥塞 控制 机 制 ， 这 种 服务 不 一 定 能 为 通信 进程 带 来 直接 好 处 ， 但 能 为 
因特网 带 来 整体 好 处 。 当 发 送 方 和 接收 方 之 间 的 网 络 出 现 拥 塞 时 ，TCP 的 拥塞 控制 机 制 会 
抑制 发 送 进程 〈 客 户 或 服务 器 ) 。 如 我 们 将 在 第 3 章 中 所 见 ，TCP 拥塞 控制 也 试图 限制 每 
个 TCP 连接 ， 使 它们 达到 公平 共享 网 络 带宽 的 目的 。 















TCP 安全 
| Kz TCP 还 是 UDP 都 没有 提供 任何 加 密 机 制 ， 这 就 是 说 发 送 进程 传 进 其 套 接 字 的 

据 ， 与 经 网 络 传送 到 目的 进程 的 数据 相同 。 因 此 ， 举 例 来 说 如 果 某 发 送 进程 以 明文 方 
| 式 ( 即 没有 加 密 ) 发 送 了 一 个 口令 进入 它 的 套 接 字 ， 该 明文 口令 将 经 过 发 送 方 与 接收 方 
之 间 的 所 有 链 路 传送 ， 这 就 可 能 在 任何 中 间 链 路 被 嗅 探 和 发 现 。 因 为 隐私 和 其 他 安全 问 
题 对 许多 应 用 而 言 已 经 成 为 至 关 重 要 的 问题 ， 所 以 因特网 界 已 经 研制 了 TCP 的 加 强 版 
本 ， 称 为 安全 套 接 字 层 (Secure Sockets Layer, SSL), J SSL 加 强 后 的 TCP 不 仅 能 够 做 
传统 的 TCP 所 能 做 的 一 切 ， 而 且 提 供 了 关键 的 进程 到 进程 的 安全 性 服务 ， 包 括 加 密 、 数 
| 据 完整 性 和 端点 鉴别 。 我 们 强调 SSL AAS TCP 和 UDP 在 相同 层次 上 的 第 三 种 因特网 
| 运输 协议 ， 而 是 一 种 对 TCP 的 加 强 ， 这 种 强化 是 在 应 用 层 上 实现 的 。 特 别 是 ， 如 果 一 个 
| 应 用 程序 要 使 用 SSL 的 服务 ， 它 需要 在 该 应 用 程序 的 客户 端 和 服务 器 端 包括 SSL 代码 
| (利用 现 有 的 、 高 度 优 化 的 库 和 类 )。SSL 有 它 自己 的 套 接 字 API， 这 类 似 于 传统 的 TCP 
| BF API。 当 一 个 应 用 使 用 SSL 时 ， 发 送 进程 向 SSL 套 接 字 传递 明文 数据 ; 在 发 送 主 
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机 中 的 SSL 则 加 密 该 数据 并 将 加 密 的 数据 传递 给 TCP 套 接 字 。 加 密 的 数据 经 因特网 传送 
到 接收 进程 中 的 TCP 套 接 字 。 该 接收 套 接 字 将 加 密 数据 传递 给 SSL， 由 其 进行 解密 。 最 


后 ，SSL 通过 它 的 SSL 套 接 字 将 明文 数据 传递 给 接收 进程 。 我 们 将 在 第 8 章 中 更 为 详细 
地 讨论 SSL, 





2. UDP 服务 

UDP 是 一 种 不 提供 不 必要 服务 的 轻 量 级 运输 协议 ， 它 仅 提 供 最 小 服务 。UDP 是 无 连 
接 的 ， 因 此 在 两 个 进程 通信 前 没有 握手 过 程 。UDP 协议 提供 一 种 不 可 靠 数据 传送 服务 ， 也 
就 是 说 ， 当 进程 将 一 个 报 文 发 送 进 UDP 套 接 字 时 ，UDP 协议 并 不 保证 该 报 文 将 到 达 接 收 
进程 。 不 仅 如 此 ， 到 达 接 收 进程 的 报 文 也 可 能 是 乱 序 到 达 的 。 

UDP 没有 包括 拥塞 控制 机 制 ， 所 以 UDP 的 发 送 端 可 以 用 它 选 定 的 任何 速率 向 其 下 层 
( 网络 层 ) 注 和 数据。( 然而， 值得 注意 的 是 实际 端 到 端 吞 吐 量 可 能 小 于 该 速率 ， 这 可 能 
是 因为 中 间 链 路 的 带宽 受 限 或 因为 拥塞 而 造成 的 。) 

3. 因特网 运输 协议 所 不 提供 的 服务 

我 们 已 经 从 4 个 方面 组 织 了 运输 协议 服务 : 可 靠 数 据 传输 、 吞 吐 量 、 定 时 和 安全 性 。 
TCP 和 UDP 提供 了 这 些 服务 中 的 哪些 呢 ? 我 们 已 经 注意 到 TCP 提供 了 可 靠 的 端 到 端 数 据 
传送 。 并 且 我 们 也 知道 TCP 在 应 用 层 可 以 很 容易 地 用 SSL 来 加 强 以 提供 安全 服务 。 但 在 我 
们 对 TCP 和 UDP 的 简要 描述 中 ， 明 显 地 漏 掉 了 对 吞吐 量 或 定时 保证 的 讨论 ， 即 这 些 服务 
目前 的 因特网 运输 协议 并 没有 提供 。 这 是 否 意味 着 诸如 因特网 电话 这 样 的 时 间 敏 感应 用 不 
能 运行 在 今天 的 因特网 上 呢 ? 答案 显然 是 否定 的 ， 因 为 在 因特网 上 运行 时 间 敏 感应 用 已 经 
有 多 年 了 。 这 些 应 用 经 常 工作 得 相当 好 ， 因 为 它们 已 经 被 设计 成 尽 最 大 可 能 对 付 这 种 保证 
的 缺乏 。 我 们 将 在 第 9 章 中 研究 几 种 设计 技巧 。 无 论 如 何 ， 在 时 延 过 大 或 端 到 端 吞 吐 量 受 
限时 ， 好 的 设计 也 是 有 限制 的 。 总 之 ， 今 天 的 因特网 通常 能 够 为 时 间 敏 感应 用 提供 满意 的 
服务 ， 但 它 不 能 提供 任何 定时 或 带宽 保证 。 

图 2-5 指出 了 一 些 流 行 的 因特网 应 用 所 使 用 的 运输 协议 。 可 以 看 到 ， 电 子 邮件 、 远 程 
终端 访问 、Web 、 文 件 传输 都 使 用 了 TCP。 这 些 应 用 选择 TCP 的 最 主要 原因 是 TCP 提供 了 
可 靠 数 据 传输 服务 ， 确 保 所 有 数据 最 终 到 达 目 的 地 。 因 为 因特网 电话 应 用 (如 Skype) iff 
常 能 够 容忍 某 些 丢失 但 要 求 达 到 一 定 的 最 小 速率 才能 有 效 工 作 ， 所 以 因特网 电话 应 用 的 开 
发 者 通常 愿意 将 该 应 用 运行 在 UDP 上 ， 从 而 设法 避 开 TCP 的 拥塞 控制 机 制 和 分 组 开销 。 
但 因为 许多 防火 墙 被 配置 成 阻挡 (大 多 数 类 型 的 ) UDP 流量 ， 所 以 因特网 电话 应 用 通常 
设计 成 如 果 UDP 通信 失败 就 使 用 TCP 作为 备份 。 


应 用 层 协议 TT 
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因特网 电话 





SIP [RFC 3261] RTP [RFC 3550] 或 专用 的 (如 Skype) 


图 2-5 流行 的 因特网 应 用 及 其 应 用 层 协 议和 支撑 的 运输 协议 
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2.1.5 应 用 层 协议 


我 们 刚刚 学 习 了 通过 把 报 文 发 送 进 套 接 字 实 现 网 络 进程 间 的 相互 通信 。 但 是 如 何 构造 
这 些 报 文 ? 在 这 些 报 文中 的 各 个 字段 的 含义 是 什么 ? 进程 何 时 发 送 这 些 报 文 ? 这 些 问题 将 
我 们 带 进 应 用 层 协议 的 范围 。 应 用 层 协 议 (application-layer protocol) 定义 了 运行 在 不 同 
端 系统 上 的 应 用 程序 进程 如 何 相互 传递 报 文 。 特 别 是 应 用 层 协 议定 义 了 : 

© 交换 的 报 文 类 型 ， 例 如 请 求 报 文 和 响应 报 文 。 

© 各 种 报 文 类 型 的 语法 ， 如 报 文中 的 各 个 字段 及 这 些 字 段 是 如 何 描述 的 。 

。 字段 的 语义 ， 即 这 些 字段 中 的 信息 的 含义 。 

© 确定 一 个 进程 何 时 以 及 如 何 发 送 报 文 ， 对 报 文 进 行 啊 应 的 规则 。 

有 些 应 用 层 协 议 是 由 RFC 文档 定义 的 ， 因 此 它们 位 于 公共 域 中 。 例 如 ，Web 的 应 用 
层 协议 HTTP ( 超 文本 传输 协议 [RFC 2616 ] ) 就 作为 一 个 RFC 可 供 使 用 。 如 果 浏 览 器 开 
发 者 遵从 HTTP RFC 规则 ， 所 开发 出 的 浏览 器 就 能 访问 任何 遵从 该 文档 标准 的 Web ARF AF 
并 获取 相应 Web 页 面 。 还 有 很 多 别 的 应 用 层 协议 是 专用 的 ， 有 意 不 为 公共 域 使 用 。 例 如 ， 
Skype 使 用 了 专用 的 应 用 层 协议 。 

区 分 网 络 应 用 和 应 用 层 协议 是 很 重要 的 。 应 用 层 协 议 只 是 网 络 应 用 的 一 部 分 (尽管 从 
我 们 的 角度 看 ， 它 是 应 用 非常 重要 的 一 部 分 ) 。 我 们 来 看 一 些 例 子 。Web 是 一 种 客户 - 服 
务 器 应 用 ， 它 允许 客户 按照 需求 从 Web 服务 器 获得 文档 。 该 Web 应 用 有 很 多 组 成 部 分 ， 
包括 文档 格式 的 标准 (EI HTML), Web 浏览 器 (如 Firefox 和 Microsoft Internet Explorer ) 、 
Web 服务 器 (如 Apache, Microsoft 服务 器 程序 ) ， 以 及 一 个 应 用 层 协议 。Web 的 应 用 层 协 
议 是 HTTP， 它 定义 了 在 济 览 器 和 Web 服务 器 之 间 传输 的 报 文 格式 和 序列 。 因 此 ，HTTP 

只 是 Web 应 用 的 一 个 部 分 (尽管 是 重要 部 分 ) 。 举 另外 一 个 例子 ， 因 特 网 电子 邮件 应 用 也 
有 很 多 组 成 部 分 ， 包 括 能 容纳 用 户 邮箱 的 邮件 服务 器 、 人 允许 用 户 读 取 和 生成 邮件 的 邮件 客 
户 程序 (如 Microsoft Outlook ) 、 定 义 电子 邮件 报 文 结构 的 标准 、 定 义 报 文 如 何在 服务 器 之 
间 以 及 如 何在 服务 器 与 邮件 客户 程序 之 间 传 递 的 应 用 层 协 议 、 定 义 如 何 对 报 文 首 部 的 内 容 
进行 解释 的 应 用 层 协议 。 用 于 电子 邮件 的 主要 应 用 层 协议 就 是 SMTP (简单 邮件 传输 协议 
[RFC5321 ] ) 。 因 此 ， 电 子 邮件 的 首要 应 用 层 协 议 SMTP 也 只 是 电子 邮件 应 用 的 一 个 部 分 
(尽管 是 重要 部 分 ) 。 


2.1.6 本 书 涉及 的 网 络 应 用 


每 天 都 有 新 的 公共 域 或 者 专用 域 因 特 网 应 用 被 开发 出 来 。 我 们 不 愿 像 百 科 全 书 一 样 
涉及 大 量 的 因特网 应 用 ， 而 是 选择 其 中 几 种 重要 而 流行 的 应 用 加 以 关注 。 在 本 章 中 我 们 
详细 讨论 5 种 重要 的 应 用 : Web 、 文 件 传输 、 电 子 邮 件 、 目 录 服 务 、 流 式 视 频 和 P2P。 
我 们 首先 讨论 Web 应 用 ， 不 仅 因为 它 是 极为 流行 的 应 用 ， 而 且 因 为 它 的 应 用 层 协 议 
HTTP 比 较 简 单 并 且 易 于 理解 。 我 们 接 下 来 讨论 电子 邮件 ， 这 是 因特网 上 第 一 个 招 人 喜 
爱 的 应 用 程序 。 说 电子 邮件 比 Web 更 复杂 ， 是 因为 它 使 用 了 多 个 而 不 是 一 个 应 用 层 协 
议 。 在 电子 邮件 之 后 ， 我 们 学 习 DNS， 它 为 因特网 提供 目录 服务 。 大 多 数 用 户 不 直接 与 
DNS 打交道 ， 而 是 通过 其 他 的 应 用 (包括 Web、 文 件 传输 和 电子 邮件 ) 间接 使 用 它 。 
DNS 很 好 地 说 明了 一 种 核心 的 网 络 功能 (网络 名 字 到 网 络 地 址 的 转换 ) 是 怎样 在 因 特 
网 的 应 用 层 实 现 的 。 然 后 我 们 讨论 PP 文件 共享 应 用 ， 通 过 讨论 包括 经 内 容 分 发 网 分 发 
存储 的 视频 在 内 的 按 需 流 式 视 频 ， 结 束 应 用 层 的 学 习 。 在 第 9 章 中 ， 我 们 将 涉及 多 媒体 


应 用 ， 包括 VolP 视频 会 议 。 
2.2 Web n HTTP 


20 世纪 90 年 代 以 前 ， 因 特 网 的 主要 使 用 者 还 是 研究 人 员 、 学 者 和 大 学 生 ， 他 们 登 
录 远 程 主机 ， 在 本 地 主机 和 远程 主机 之 间 传 输 文件 ， 收 发 新 闻 ， 收 发 电子 邮件 。 尽 管 这 
些 应 用 非常 有 用 (并且 继续 如 此 ), 但 是 因特网 基本 上 不 为 学 术 界 和 研究 界 之 外 所 知 。 
到 了 20 世纪 90 年 代 初 期 ， 一 个 主要 的 新 型 应 用 即 万 维 网 (World Wide Web) 登 上 了 舞台 
[ Berners-Lee 1994 ] 。Web 是 一 个 引起 公众 注意 的 因特网 应 用 ， 它 极 大 地 改变 了 人 们 与 工 
作 环 境内 外 交流 的 方式 。 它 将 因特网 从 只 是 很 多 数据 网 之 一 的 地 位 提升 为 仅 有 的 一 个 数 
据 网 。 

也 许 对 大 多 数 用 户 来 说 ， 最 具有 吸引 力 的 就 是 Web 的 按 需 操作 。 当 用 户 需 要 时 ， 就 
能 得 到 所 想 要 的 内 容 。 这 不 同 于 无 线 电 广播 和 电视 ， 它 们 迫使 用 户 只 能 收听 、 收 看 内 容 提 
供 者 提供 的 节目 。 除 了 可 以 按 需 操 作 以 外 ，Web 还 有 很 多 让 人 们 喜欢 和 珍爱 的 特性 。 任 何 
人 使 信息 在 Web 上 可 用 都 非常 简单 ， 即 只 需要 极 低 的 费用 就 能 成 为 出 版 人 。 超 链接 和 搜 
索引 擎 帮助 我 们 在 Web 站 点 的 海洋 里 导航 。 图 片 和 视频 刺激 着 我 们 的 感官 。 表 单 、 
JavaScript, 、jJava. 小 程序 和 很 多 其 他 的 装置 ， 使 我 们 可 以 与 Web 页 面 和 站 点 进行 交互 。 并 
H, Web 及 其 协议 作为 平台 ， 为 YouTube、 基 于 Web 的 电子 邮件 (如 Gmail) 和 大 多 数 移 
动因 特 网 应 用 (包括 Instagram 和 谷歌 地 图 ) 服务 。 


2.2.1 HTTP RA 


Web 的 应 用 层 协 议 是 超 文本 传输 协议 (HyperText Transfer Protocol, HTTP), Et Web 
的 核心 ,在 [RFC 1945] 和 [RFC 2616] 中 进行 了 定义 。HTTP 由 两 个 程序 实现 : 一 个 客 
户 程序 和 一 个 服务 器 程序 。 客 户 程序 和 服务 器 程序 运行 在 不 同 的 端 系 统 中 ， 通 过 交换 
HTTP 报 文 进行 会 话 。HTTP 定义 了 这 些 报 文 的 结构 以 及 客户 和 服务 器 进行 报 文 交换 的 方 
式 。 在 详细 解释 HTTP 之 前 ， 应 当 回 顾 某 些 Web 术语 。 

Web Tif] (Web page) (也 叫 文档 ) 是 由 对 象 组 成 的 。 一 个 对 象 (object) 只 是 一 个 文 
件 ， 诸 如 一 个 HTML 文件 、 一 个 JPEG 图 形 、 一 个 Java 小 程序 或 一 个 视频 片段 这 样 的 文件 ， 
且 它 们 可 通过 一 个 URL 地 址 寻 址 。 多 数 Web 页 面 含 有 一 个 HTML 基本 文件 (base HTML 
file) 以 及 几 个 引用 对 象 。 例 如 ， 如 果 一 个 Web 页 面包 含 HTML 文本 和 5 个 JPEG 图 形 ， 那 
么 这 个 Web 页 面 有 6 个 对 象 : 一 个 HTML 基本 文件 加 5 个 图 形 。HTML 基本 文件 通过 对 象 
的 URL 地 址 引用 页 面 中 的 其 他 对 象 。 每 个 URL 地 址 由 两 部 分 组 成 : 存放 对 象 的 服务 器 主 
机 名 和 对 象 的 路 径 名 。 例 如 ，URL 地 址 http://www. someSchool. edu/someDepariment/ pic- 
ture. gf， 其 中 的 www. someSchool. edu 就 是 主机 名 ，/someDepartment/picture. gif 就 是 路 径 
名 。 因 为 Web 浏览 器 (Web browser) (例如 Internet Explorer 和 Firefox) 实现 了 HTTP 的 客 
Pin, E Web 环境 中 我 们 经 常 交 蔡 使 用 “浏览 器 ”和 “客户 ”这 两 个 术语 。Web Ak 
See (Web server) 实现 了 HTTP MARS atm, EA FARA Web 对 象 ， 每 个 对 象 由 URL 寻 
址 。 流 行 的 Web 服务 器 有 Apache 和 Microsoft Internet Information Server (微软 互联 网 信息 
AR AF) 。 

HTTP 定义 了 Web 客户 向 Web 服务 器 请 求 Web 页 面 的 方式 ， 以 及 服务 器 向 客户 传 
送 Web 页 面 的 方式 。 我 们 稍 后 详细 讨论 客户 和 服务 器 的 交互 过 程 ， 而 其 基本 思想 在 


kA & 65 


图 2-6 中 进行 了 图 示 。 当 用 户 请 求 一 个 Web 页 面 (如 点 击 一 个 超 链 接 ) 时 ,浏览 器 向 


服务 需 发 出 对 该 页 面 中 所 包含 对 象 的 运行 Apache Web 
HTTP 请 求 报 文 ， 服 务 器 接收 到 请 求 并 用 服务 器 的 服务 器 
包含 这 些 对 象 的 HTTP 啊 应 报 文 进 行 

Mel DE o 


HTTP 使 用 TCP 作为 它 的 支撑 运输 协 
议 (而 不 是 在 UDP 上 运行 )。HTTP 客户 
首先 发 起 一 个 与 服务 器 的 TCP 连接 。 一 
连接 建立 ， 该 浏览 右 和 服务 需 进 程 就 可 以 
通过 套 接 字 接 口 访 问 TCP。 如 同 在 2.1 节 
中 描述 的 那样 ， 客 户 端的 套 接 字 接口 是 客 ” 
户 进程 与 TCP 连接 之 间 的 门 ， 在 服务 器 端 ee 
的 套 接 字 接口 则 是 服务 器 进程 与 TCP 连接 
之 间 的 门 。 客 户 向 它 的 套 接 字 接口 发 送 图 2-6 HTTP 的 请 求 - 啊 应 行为 
HTTP 请 求 报 文 并 从 它 的 套 接 字 接 口 接收 HTTP 响应 报 文 。 类 似 地 ， 服 务 器 从 它 的 套 接 字 
接口 接收 HTTP 请 求 报 文 和 向 它 的 套 接 字 接 口 发 送 HTTP 响应 报 文 。 一 旦 客户 向 它 的 套 接 
字 接 口 发 送 了 一 个 请 求 报 文 ， 该 报 文 就 脱离 了 客户 控制 并 进入 TCP 的 控制 。2. 1 节 讲 过 ， 
TCP 为 HTTP 提供 可 靠 数据 传输 服务 。 这 意味 着 ,一 个 客户 进程 发 出 的 每 个 HTTP 请 求 报 
文 最 终 能 完整 地 到 达 服 务 器 ; 类 似 地 ， 服 务 器 进程 发 出 的 每 个 HTTP 响应 报 文 最 终 能 完整 
地 到 达 客 户 。 这 里 我 们 看 到 了 分 层 体 系 结构 最 大 的 优点 ， 即 HTTP 协议 不 用 担心 数据 丢 
失 ， 也 不 关注 TCP 从 网 络 的 数据 丢失 和 乱 序 故障 中 恢复 的 细 记 。 那 是 TCP 以 及 协议 栈 较 
低层 协议 的 工作 。 

注意 到 下 列 现象 很 重要 : 服务 器 向 客户 发 送 被 请 求 的 文件 ， 而 不 存储 任何 关于 该 客户 
的 状态 信息 。 假 如 某 个 特定 的 客户 在 短 短 的 几 秒 内 两 次 请 求 同 一 个 对 象 ， 服 务 器 并 不 会 因 
为 刚刚 为 该 客户 提供 了 该 对 象 就 不 再 做 出 反应 ， 而 是 重新 发 送 该 对 象 ， 就 像 服务 器 已 经 完 
忘记 不 久之 前 所 做 过 的 事 一 样 。 因 为 HTTP 服务 器 并 不 保存 关于 客户 的 任何 信息 ， 所 以 
我 们 说 HTTP 是 一 个 无 状态 协议 (stateless protocol ) 。 我 们 同时 也 注意 到 Web 使 用 了 客户 
-服务 器 应 用 程序 体系 结构 (如 2. 1 节 所 述 ) Web 服务 器 总 是 打开 的 ， 具 有 一 个 固定 的 
IP 地 址 ， 且 它 服 务 于 可 能 来 自 数 以 百 万 计 的 不 同 浏览 器 的 请 求 。 


2.2.2 非 持续 连接 和 持续 连接 


在 许多 因特网 应 用 程序 中 ， 客 户 和 服务 需 在 一 个 相当 长 的 时 间 范 围 内 通信 ， 其 中 客户 
发 出 一 系列 请 求 并 且 服 务 器 对 每 个 请 求 进行 响应 。 依 据 应 用 程序 以 及 该 应 用 程序 的 使 用 方 
这 一 系列 请 求 可 以 以 规则 的 间隔 周期 性 地 或 者 间断 性 地 一 个 接 一 个 发 出 。 当 这 种 客 

-服务 器 的 交互 是 经 TCP EG, ARDEA MOTOS SUES TEENE 即 每 个 请 
nt ee 还 是 所 有 的 请 求 及 其 响应 经 相同 的 TCP 连接 发 
送 呢 ? 采用 前 一 种 方法 ， 该 应 用 程序 被 称 为 使 用 非 持 续 连接 (non- persistent connection) ; 
采用 后 一 种 方法 ， 该 应 用 程序 被 称 为 使 用 持续 连接 (persistent connection ) 。 为 了 深入 地 理 
解 该 设计 问题 ， 我 们 研究 在 特定 的 应 用 程序 即 HTTP 的 情况 下 持续 连接 的 优点 和 缺点， 
HTTP 既 能 够 使 用 非 持续 连接 ， 也 能 够 使 用 持续 连接 。 尽 管 HTTP 在 其 默认 方式 下 使 用 持 
续 连 接 ，HTTP 客户 和 服务 器 也 能 配置 成 使 用 非 持 续 连 接 。 
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1. 采用 非 持续 连接 的 HTTP 


我 们 看 看 在 非 持续 连接 情况 下 ， 从 服务 器 向 客户 传送 一 个 Web 页 面 的 步 又。 假设 该 页 
面 含有 一 个 HTML 基本 文件 和 10 个 JPEG 图 形 ， 并 且 这 11 个 对 象 位 于 同一 台 服 务 器 上 。 进 
一 步 假设 该 HTML 文件 的 URL 为 http://www. someSchool. edu/someDepartment/home. index, 

我 们 看 看 发 生 了 什么 情况 : 

1) HTTP 客户 进程 在 端口 号 80 发 起 一 个 到 服务 器 www. someSchool. edu 的 TCP 连接 ， 
该 端口 号 是 HTTP 的 默认 端口 。 在 客户 和 服务 器 上 分 别 有 一 个 套 接 字 与 该 连接 相关 联 。 

2) HTTP 客户 经 它 的 套 接 字 向 该 服务 器 发 送 一 个 HTTP 请 求 报 文 。 请 求 报 文中 包含 了 
路 径 名 /someDepartment/home. index 〈 后面 我 们 会 详细 讨论 HTTP 报 文 ) 。 

3) HTTP 服务 器 进程 经 它 的 套 接 字 接收 该 请 求 报 文 ， 从 其 存储 右 (RAM 或 磁盘 ) 中 
检索 出 对 象 www. someSchool. edu/someDepartment/home. index ， 在 一 个 HTTP 啊 应 报 文 中 封 
PWR, HALRB ETF AEP RIK MG NVI 

4) HTTP 服务 天 进程 通知 TCP 断 开 该 TCP 连接 。 (但 是 直到 TCP 确认 客户 已 经 完整 
地 收 到 响应 报 文 为 止 ， 它 才 会 实际 中 断 连接 。) 

5) HTTP 客户 接收 响应 报 文 ，TCP 连接 关闭 。 该 报 文 指出 封装 的 对 象 是 一 个 HTML X 
件 ， 客 户 从 响应 报 文中 提取 出 该 文件 ， 检 查 该 HTML 文件 ， 得 到 对 10 个 JPEG 图 形 的 引用 。 

6) 对 每 个 引用 的 JPEG 图 形 对 象 重复 前 4 个 步 又 。 

当 浏 览 器 收 到 Web 页 面 后 ， 向 用 户 显 示 该 页 面 。 两 个 不 同 的 浏览 器 也 许 会 以 不 同 的 
方式 解释 ( 即 向 用 户 显 示 ) 该 页 面 。HTTP 与 客户 如 何 解释 一 个 Web 页 面 毫 无 关系 。 
HTTP 规范 ( [RFC 1945] 和 [RFC 2616]) 仅 定 义 了 在 HTTP 客户 程序 与 HTTP 服务 器 程 
序 之 间 的 通信 协议 。 

上 面 的 步骤 举例 说 明了 非 持 续 连 接 的 使 用 ， 其 中 每 个 TCP 连接 在 服务 器 发 送 一 个 对 象 后 
关闭 ， 即 该 连接 并 不 为 其 他 的 对 象 而 持续 下 来 。 值 得 注意 的 是 每 个 TCP 连接 只 传输 一 个 请 求 
报 文 和 一 个 响应 报 文 。 因 此 在 本 例 中 ， 当 用 户 请 求 该 Web 页 面 时 ， 要 产生 11 个 TCP 连接 。 

在 上 面 描述 的 步骤 中 ， 我 们 有 意 没 有 明确 客户 获得 这 10 个 JPEG 图 形 对 象 是 使 用 10 个 串 
行 的 TCP 连接 ， 还 是 某 些 JPEG 对 象 使 用 了 一 些 并 行 的 TCP 连接 。 事 实 上 ， 用 户 能 够 配置 现代 
浏览 器 来 控制 连接 的 并 行 度 。 在 默认 方式 下 ， 大 部 分 浏览 器 打开 5 ~ 10 个 并 行 的 TCP 连接 ， 而 
每 条 连接 处 理 一 个 请 求 响应 事务 。 如 果 用 户 愿意 ， 最 大 并 行 连接 数 可 以 设置 为 1， 这 样 10 RE 
接 就 会 串 行 建立 。 我 们 在 下 一 章 会 看 到 ， 使 E 
用 并 行 连接 可 以 缩短 响应 时 间 。 L 

在 继续 讨论 之 前 ， 我 们 来 简单 估算 一 下 
从 客户 请 求 HTML 基本 文件 起 到 该 客户 收 到 
整个 文件 止 所 花费 的 时 间 。 为 此 ， 我 们 给 出 
往返 时 间 (Round-Trip Time, RTT) 的 定义 ， 
该 时 间 是 指 一 个 短 分 组 从 客户 到 服务 器 然后 
再 返回 客户 所 花费 的 时 间 。RTT 包括 分 组 传 
播 时 延 、 分 组 在 中 间 路 由 器 和 交换 机 上 的 排 
队 时 延 以 及 分 组 处 理 时 延 (这 些 时 延 在 
1.4 节 已 经 讨论 过 ) 。 现 在 考虑 当 用 户 点 击 客户 的 时 间 服务 器 的 时 间 
超 链接 时 会 发 生 什么 现象 。 如 图 2-7 所 示 ， 图 2-7 请 求 并 接收 一 个 HTML 文件 所 需 的 时 间 估 算 


发 起 TCP 连 接 





kA 67 


这 引起 浏览 器 在 它 和 Web 服务 器 之 间 发 起 一 个 TCP ER; 这 涉及 一 次 “三 次 握手 ”过 程 ， 
即 客户 向 服务 器 发 送 一 个 小 TCP 报 文 人 段 ， 服 务 器 用 一 个 小 TCP 报 文 段 做 出 确认 和 啊 应 ， 
最 后 ， 客 户 向 服务 器 返回 确认 。 三 次 握手 中 前 两 个 部 分 所 耗费 的 时 间 占 用 了 一 个 RTT。 完 
成 了 三 次 握手 的 前 两 个 部 分 后 ， 客 户 结合 三 次 握手 的 第 三 部 分 (确认 ) WK TCP 连接 发 
送 一 个 HTTP 请 求 报 文 。 一 旦 该 请 求 报 文 到 达 服 务 器 ， 服 务 器 就 在 该 TCP 连接 上 发 送 
HTML 文 件 。 该 HTTP 请 求 /响应 用 去 了 男 一 个 RTT。 因 此 ,粗略 地 讲 ， 总 的 响应 时 间 就 是 
两 个 RTT 加 上 服务 器 传输 HTML 文件 的 时 间 。 
2. 采用 持续 连接 的 HTTP 


非 持 续 连 接 有 一 些 缺 点 。 第 一 ， 必 须 为 每 一 个 请 求 的 对 象 建立 和 维护 一 个 全 新 的 连 
接 。 对 于 每 个 这 样 的 连接 ， 在 客户 和 服务 器 中 都 要 分 配 TCP 的 缓冲 区 和 保持 TCP 变量 ， 
这 给 Web 服务 器 带 来 了 严重 的 负担 ， 因 为 一 台 Web 服务 器 可 能 同时 服务 于 数 以 百 计 不 同 
的 客户 的 请 求 。 第 二 ， 就 像 我 们 刚 描述 的 那样 ， 每 一 个 对 象 经 受 两 倍 RTT 的 交付 时 延 ， 
即 一 个 RTT 用 于 创建 TCP， 男 一 个 RTT 用 于 请 求 和 接收 一 个 对 象 。 

在 采用 HTTP 1. 1 持续 连接 的 情况 下 ， 服 务 器 在 发 送 响应 后 保持 该 TCP 连接 打开 。 在 
相同 的 客户 与 服务 器 之 间 ， 后 续 的 请 求 和 响应 报 文 能 够 通过 相同 的 连接 进行 传送 。 特 别 
是 ， 一 个 完整 的 Web 页 面 (上 例 中 的 HTML 基本 文件 加 上 10 个 图 形 ) 可 以 用 单个 持续 
TCP 连接 进行 传送 。 更 有 甚 者 ， 位 于 同一 台 服 务 器 的 多 个 Web 页 面 在 从 该 服务 器 发 送 给 同 
一 个 客户 时 ， 可 以 在 单个 持续 TCP 连接 上 进行 。 对 对 象 的 这 些 请 求 可 以 一 个 接 一 个 地 发 
出 ， 而 不 必 等 竺 对 未 决 请 求 〈 流 水 线 ) 的 回答 。 一 般 来 说 ， 如 果 一 条 连接 经 过 一 定时 间 间 
Ba (一 个 可 配置 的 超时 间隔 ) 仍 未 被 使 用 ，HTTP 服务 器 就 关闭 该 连接 。HTTP 的 默认 模 
式 是 使 用 带 流水 线 的 持续 连接 。 最 近 ，HTTP/2 [ RFC 7540] 是 在 HTTP 1.1 基础 上 构建 
的 ， 它 允许 在 相同 连接 中 多 个 请 求 和 回答 交错 ， 并 增加 了 在 该 连接 中 优化 HTTP 报 文 请 求 
和 回答 的 机 制 。 我 们 把 量化 比较 持续 连接 和 非 持 续 连 接 性 能 的 任务 留 作 第 2、3 章 的 课 后 
习题 。 鼓 励 读 者 阅读 文献 [Heidemann 1997; Nielsen 1997; RFC 7540 ] 。 


2.2.3 HTTP 报 文 格式 


HTTP 规范 [ RFC 1945; RFC 2616; RFC 7540] 包含 了 对 HTTP 报 文 格式 的 定义 。HTTP 
报 文 有 两 种 : 请 求 报 文 和 响应 报 文 。 下 面 讨 论 这 两 种 报 文 。 

1. HTTP 请 求 报 文 

下 面 提供 了 一 个 典型 的 HTTP 请 求 报 文 : 

GET /somedir/page.html HTTP/1.1 

Host: www.someschool.edu 

Connection: close 


User-agent: Mozilla/5.0 
Accept-language: fr 


通过 仔细 观察 这 个 简单 的 请 求 报 文 ， 我 们 就 能 学 到 很 多 东西 。 首 先 ， 我们 看 到 该 报 文 
是 用 普通 的 ASCII 文本 书写 的 ， 这 样 有 一 定 计算 机 知识 的 人 都 能 够 阅读 它 。 其 次 ， 我 们 看 
到 该 报 文 由 5 行 组 成 ， 每 行 由 一 个 回 车 和 换行 符 结束 。 最 后 一 行 后 再 附加 一 个 回 车 换行 
符 。 虽 然 这 个 特定 的 报 文 仅 有 5 行 ， 但 一 个 请 求 报 文 能 够 具有 更 多 的 行 或 者 至 少 为 一 行 。 
HTTP 请 求 报 文 的 第 一 行 叫 作 请 求 行 (request line), ， 其 后 继 的 行 叫 作 首部 行 (header 
line) 。 请 求 行 有 3 个 字段 : 方法 字段 、URL 字段 和 HTTP 版 本 字段 。 方 法 字段 可 以 取 几 种 
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不 同 的 值 ， 包 括 GET, POST, HEAD, PUT 和 DELETE。 绝 大 部 分 的 HTTP 请 求 报 文 使 用 
GET 方法 。 当 浏览 器 请 求 一 个 对 象 时 ， 使 用 CET 方法 ,在 URL 字段 带 有 请 求 对 象 的 标识 。 
在 本 例 中 ， 该 浏览 器 正在 请 求 对 象 /somedirpage. html。 其 版 本 字段 是 自 解 释 的 ; 在 本 例 
中 ， 浏 览 器 实现 的 是 HTTP/1. 1 版 本 。 

现在 我 们 看 看 本 例 的 首部 行 。 首 部 行 Host: www. someschool. edu 指明 了 对 象 所 在 的 主 
机 。 你 也 许 认为 该 首部 行 是 不 必要 的 ， 因 为 在 该 主机 中 已 经 有 一 条 TCP 连接 存在 了 。 但 
是 ， 如 我 们 将 在 2. 2.5 节 中 所 见 ， 该 首部 行 提供 的 信息 是 Web 代理 高 速 缓 存 所 要 求 的 。 通 
过 包含 Connection: close 首部 行 ， 该 浏览 器 告诉 服务 器 不 要 麻烦 地 使 用 持续 连接 ， 它 要 求 
服务 器 在 发 送 完 被 请 求 的 对 象 后 就 关闭 这 条 连接 。User-agent: 首部 行 用 来 指明 用 户 代理 ， 
即 回 服务 器 发 送 请求 的 浏览 右 的 类 型 。 这 里 浏览 器 类 型 是 Mozilla/5.0， 即 Firefox XI W AF o 
这 个 首部 行 是 有 用 的 ， 因 为 服务 器 可 以 有 效 地 为 不 同类 型 的 用 户 代理 实际 发 送 相同 对 象 的 
不 同 版 本 。( 每 个 版 本 都 由 相同 的 URL hk.) 最 后 ，Accept-language: 首部 行 表 示 用 户 想 
得 到 该 对 象 的 法 语 版 本 (如 果 服 务 器 中 有 这 样 的 对 象 的 话 ) ; 否则， 服务器 应 当 发 送 它 的 
默认 版 本 。Accept-language: 首部 行 仅 是 HTTP 中 可 用 的 众多 内 容 协商 首部 之 一 。 

看 过 一 个 例子 之 后 ， 我 们 再 来 看 看 如 图 2-8 所 示 的 一 个 请 求 报 文 的 通用 格式 。 我 们 看 
到 该 通用 格式 与 我 们 前 面 的 例子 密切 对 We 
应 。 然 而 ， 你 可 能 已 经 注意 到 了 在 首部 请 求生 Pee zÇ URL | 
行 ( 和 附加 的 回 车 和 换行 ) 后 有 一 zz : 
“实体 体 ” (entity body), (FY GET X 
法 时 实体 体 为 空 ， 而 使 用 POST 方法 时 
才 使 用 该 实体 体 。 当 用 户 提交 表单 时 ， $ 
HTTP 客户 常常 使 用 POST 方法 ， 例 如 7 d Aa 
当 用 户 向 搜索 引擎 提供 搜索 关键 词 时 。 
使 用 POST 报 文 时 ， 用 户 仍 可 以 向 服务 | : 
器 请 求 一 个 Web 页 面 ， 但 Web 页 面 的 四 ENCE ER o Neary aie oles Fle RS hers 
特定 内 容 依赖 于 用 户 在 表单 字段 中 输入 
的 内 容 。 如 果 方 法 字段 的 值 为 POST 时 ， 
则 实体 体 中 包含 的 就 是 用 户 在 表单 字段 中 的 输入 值 。 

当然 ， 如 果 不 提 “用 表单 生成 的 请 求 报 文 不 是 必须 使 用 POST 方法 ”这 一 点 ， 那 将 是 
失职 。 相 反 ，HTML 表单 经 常 使 用 GET 方法 ， 并 在 (表单 字段 中 ) 所 请 求 的 URL 中 包括 
输入 的 数据 。 例 如 ， poep GET 方法 ， 它 有 两 个 字段 ， 分 别 填 写 的 是 “monkeys” 
和 “bananas”， 这 样 ， 该 URL 结构 为 www. somesite. com/animalsearch? monkeys&bananas 。 
在 日 复 一 日 的 网 上 冲浪 中 ， 你 也 许 已 经 留意 到 了 这 种 扩展 的 URL。 

HEAD 方法 类 似 于 GET 方法 。 当 服务 器 收 到 一 个 使 用 HEAD 方法 的 请 求 时 ， 将 会 用 一 
个 HTTP 报 文 进行 响应 ， 但 是 并 不 返回 请 求 对 象 。 应 用 程序 开发 者 常用 HEAD 方法 进行 调 
WIRE Ro PUT 方法 常 与 Web 发 行 工 具 联 合 使 用 ， 它 允许 用 户 上 传 对 象 到 指定 的 Web 服务 
器 上 指定 的 路 径 (目录 )。PUT 方法 也 被 那些 需要 向 Web 服务 器 上 传 对 象 的 应 用 程序 使 
用 。DELETE 方法 允许 用 户 或 者 应 用 程序 删除 Web 服务 器 上 的 对 象 。 


2. HTTP 响应 报 文 
下 面 我 们 提供 了 一 条 典型 的 HTTP 响应 报 文 。 该 响应 报 文 可 以 是 对 刚刚 讨论 的 例子 中 





图 2-8 一 个 HTTP 请 求 报 文 的 通用 格式 


kA & 69 


请 求 报 文 的 啊 应 


HTTP/1.1 200 OK 

Connection: close 

Date: Tue, 18 Aug 2015 15:44:04 GMT 

Server: Apache/2.2.3 (CentOS) 

Last-Modified: Tue, 18 Aug 2015 15:11:03 GMT 
Content-Length: 6821 

Content-Type: text/html 


(data data data data data ...) 


我 们 仔细 看 一 下 这 个 响应 报 文 。 它 有 三 个 部 分 : 一 个 初始 状态 行 (status line), 6 个 
首部 行 (header line) ， 然 后 是 实体 体 (entity body) 。 实 体 体 部 分 是 报 文 的 主要 部 分 ， 即 它 
包含 了 所 请 求 的 对 象 本 身 (表示 为 data data data data data … ) 。 状 态 行 有 3 个 字段 : 协议 
版 本 字段 、 状 态 码 和 相应 状态 信息 。 在 这 个 例子 中 ， 状 态 行 指示 服务 器 正在 使 用 HTTP/ 

1 ， 并 且 一 切 正 常 〈 即 服务 器 已 经 找到 并 正在 发 送 所 请 求 的 对 象 ) 。 

我 们 现在 来 看 看 首部 行 。 服 务 器 用 Connection; close 首部 行 告诉 客户 ， 发 送 完 报 文 后 
将 关闭 该 TCP HEHE, Date: 首部 行 指示 服务 器 产生 并 发 送 该 响应 报 文 的 日 期 和 时 间 。 值 得 
一 提 的 是 ， 这 个 时 间 不 是 指 对 象 创建 或 者 最 后 修改 的 时 间 ， 而 是 服务 器 从 它 的 文件 系统 中 
检索 到 该 对 象 ， 将 该 对 象 插 入 响应 报 文 ， 并 发 送 该 响应 报 文 的 时 间 。Server: 首部 行 指 示 
该 报 文 是 由 一 台 Apache Web 服务 器 产生 的 ， 它 类 似 于 HTTP 请 求 报 文中 的 User-agent; 首 
部 行 。Last- Modified : 首部 行 指示 了 对 象 创建 或 者 最 后 修改 的 日 期 和 时 间 。Last- Modified ; 
首部 行 对 既 可 能 在 本 地 客户 也 可 能 在 na 
网 络 缓存 服务 器 上 的 对 象 缓存 来 说 非 闵行 
常 重要 。 我 们 将 很 快 详细 地 讨论 缓存 E 
服务 器 〈 也 叫 代理 服务 器 ) Content- _ 
Length: 首部 行 指示 了 被 发 送 对 象 中 的 | 
字 节 数 。Content- Type: 首部 行 指示 了 i 
实体 体 中 的 对 象 是 HTML 文本 。( 该 对 AF erfir 
象 类 型 应 该 正式 地 由 Content- Type: 首 Vig dae 
部 行 而 不 是 用 文件 扩展 名 来 指示 。) 7 ‘= | 

看 过 一 个 例子 后 ， 我 们 再 来 查看 a 
响应 报 文 的 通用 格式 ， 如 图 2-9 所 示 。 网 
该 通用 格式 与 前 面 例子 中 的 响应 报 文 Bee SO a ER 
相 匹 配 。 我 们 补充 说 明 一 下 状态 码 和 它们 对 应 的 短语 。 状 态 码 及 其 相应 的 短语 指示 了 请 求 
的 结果 。 一 些 常见 的 状态 码 和 相关 的 短语 包括 : 

e 200 OK: 请 求 成 功 ， 信 息 在 返回 的 响应 报 文中 。 

e 301 Moved Permanently: 请 求 的 对 象 已 经 被 永久 转移 了 ， 新 的 URL 定义 在 响应 报 

MH Location; 首部 行 中 。 客 户 软 件 将 自动 获取 新 的 URL, 

e 400 Bad Request; 一 个 通用 差错 代码 ， 指 示 该 请 求 不 能 被 服务 器 理解 。 

© 404 Not Found; 被 请 求 的 文档 不 在 服务 器 上 。 

e 505 HTTP Version Not Supported: 服务 器 不 支持 请 求 报 文 使 用 的 HTTP 协议 版 本 。 

你 想 看 一 下 真实 的 HTTP 响应 报 文 吗 ? 这 正 是 我 们 高 度 推 荐 而 且 也 很 容易 做 到 的 事 。 
首先 用 Telnet 登录 到 你 喜欢 的 Web 服务 器 上 ， 接 下 来 输入 一 个 只 有 一 行 的 请 求 报 文 去 请 求 
放 在 该 服务 器 上 的 某 些 对 象 。 例 如 ， 假 设 你 看 到 命令 提示 ， 键 入 : 
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telnet gaia.cs.umass.edu 80 


GET /kurose_ross/interactive/index.php HTTP/1.1 
Host: gaia.cs.umass.edu 


(在 输入 最 后 一 行 后 连续 按 两 次 回 车 。) 这 就 打开 一 个 到 主机 gaia. cs. umass. edu 的 80 
端口 的 TCP 连接 ， 并 发 送 一 个 HTTP 请 求 报 文 。 你 将 会 看 到 一 个 携带 包括 本 书 交 互 式 课 后 
作业 的 基本 HTML 文件 的 响应 报 文 。 如 果 你 只 是 想 看 一 下 HTTP 协议 的 报 文 行 ， 而 不 是 获 
取 对 象 本 身 的 话 ， 那 么 可 以 用 HEAD 代替 GET, 

在 本 节 中 ， 我 们 讨论 了 HTTP 请 求 报 文 和 响应 报 文中 的 一 些 首部 行 。HTTP 规范 中 定 
义 了 许 许 多 多 的 首部 行 ， 这 些 首 部 行 可 以 被 浏览 器 、Web 服务 器 和 Web 缓存 服务 器 插入 。 
我 们 只 提 到 了 全 部 首部 行 中 的 少数 几 个 ， 在 2. 2.5 节 中 我 们 讨论 网 络 Web 缓存 时 还 会 涉及 
其 他 几 个 。 一 本 可 读 性 很 强 的 文献 是 | Krishnamurty 2001 ] ， 它 对 HTTP 协议 (包括 它 的 首 
部 行 和 状态 码 ) 进行 了 广泛 讨论 。 

浏览 器 是 如 何 决定 在 一 个 请 求 报 文 中 包含 哪些 首部 行 的 呢 ?Web 服务 器 又 是 如 何 决定 
在 一 个 响应 报 文中 包含 哪些 首部 行 呢 ”浏览 器 产生 的 首部 行 与 很 多 因素 有 关 ， 包 括 浏 览 器 
的 类 型 和 协议 版 本 (例如 ，HTTP/1.0 浏览 器 将 不 会 产生 任何 1.1 版 本 的 首部 行 )、 浏 览 器 
的 用 户 配置 (如 喜好 的 语言 ) 、 浏 览 器 当前 是 否 有 一 个 缓存 的 但 是 可 能 超期 的 对 象 版 本 。 
Web 服务 器 的 表现 也 类 似 : 在 产品 、 版 本 和 配置 上 都 有 差异 ， 所 有 这 些 都 会 影响 响应 报 文 
中 包含 的 首部 行 。 


2.2.4 用 户 与 服务 器 的 交互 : cookie 


我 们 前 面 提 到 了 HTTP 服务 器 是 无 状态 的 。 这 简化 了 服务 器 的 设计 ， 并 且 人 允许 工程 师 
们 去 开发 可 以 同时 处 理 数 以 千 计 的 TCP 连接 的 高 性 能 Web 服务 器 。 然 而 一 个 Web 站 点 通 
常 希望 能 够 识别 用 户 ， 可 能 是 因为 服务 器 希望 限制 用 户 的 访问 ,或 者 因为 它 希 望 把 内 容 与 
用 户 身份 联系 起 来 。 为 此 ，HTTP 使 用 了 cookie, cookie 在 [RFC 6265] 中 定义 ， 它 允许 
站 点 对 用 户 进行 跟踪 。 目 前 大 多 数 商 务 Web 站 点 都 使 用 了 cookie, 

如 图 2-10 所 示 ，cookie 技术 有 4 个 组 件 : OE HTTP 响应 报 文中 的 一 个 cookie 首部 
ÍT; DQE HTTP 请 求 报 文中 的 一 个 cookie 首部 行 ; @@ 在 用 户 端 系统 中 保留 有 一 个 cookie X 
件 ， 并 由 用 户 的 浏览 器 进行 管理 ，@@ 位 于 Web 站 点 的 一 个 后 端 数 据 库 。 使 用 图 2-10， 我 
们 通过 一 个 典型 的 例子 看 看 cookie 的 工作 过 程 。 假 设 Susan 总 是 从 家 中 PC 使 用 Internet 
Explorer 上 网 ， 她 首次 与 Amazon. com 联系 。 我 们 假定 过 去 她 已 经 访问 过 eBay 站 点 。 当 请 
求 报 文 到 达 该 Amazon Web 服务 器 时 ， 该 Web 站 点 将 产生 一 个 唯一 识别 码 ， 并 以 此 作为 索 
引 在 它 的 后 端 数 据 库 中 产生 一 个 表 项 。 接 下 来 Amazon Web 服务 器 用 一 个 包含 Set-cookie: 
首部 的 HTTP 响应 报 文 对 Susan 的 浏览 器 进行 啊 应 ， 其 中 Set-cookie: 首部 含有 该 识别 码 。 
例如 ， 该 首部 行 可 能 是 
Set-cookie: 1678 

X Susan 的 浏览 器 收 到 了 该 HTTP 响应 报 文 时 ， 它 会 看 到 该 Set-cookie: 首部 。 该 浏览 
器 在 它 管理 的 特定 cookie 文件 中 添加 一 行 ， 该 行 包含 服务 器 的 主机 名 和 在 Set-cookie: 首部 
中 的 识别 码 。 值 得 注意 的 是 该 cookie 文件 已 经 有 了 用 于 eBay 的 表 项 ， 因 为 Susan 过 去 访问 过 
该 站 点 。 当 Susan 继续 浏览 Amazon 网 站 时 ， 每 请 求 一 个 Web 页 面 ， 其 浏览 器 就 会 查询 该 
cookie 文件 并 抽取 她 对 这 个 网 站 的 识别 码 ， 并 放 到 HTTP 请 求 报 文中 包括 识别 码 的 cookie 首 


kt Al & 71 


部 行 中 。 特 别 是 ， 发 往 该 Amazon 服务 器 的 每 个 HTTP 请 求 报 文 都 包括 以 下 首部 行 : 


Cookie: 1678 


在 这 种 方式 下 ，Amazon 服务 器 可 以 跟踪 Susan 在 Amazon 站 点 的 活动 。 尽 管 Amazon 
Web 站 点 不 必 知 道 Susan 的 名 字 ， 但 它 确 切 地 知道 用 户 1678 按照 什么 顺序 、 在 什么 时 间 、 
访问 了 哪些 页 面 ! Amazon 使 用 cookie 来 提供 它 的 购物 车 服务 ， 即 Amazon 能 够 维护 Susan 
希望 购买 的 物品 列表 ， 这 样 在 Susan 结束 会 话 时 可 以 一 起 为 它们 付费 。 














客户 主机 服务 器 主机 
4 ‘i 
SR 
ia 
ebay:8734 TPR te : 
x :__” 服务 器 为 用 户 
: di : 创建 ID 1678 
:Pood ~ : 后 端 数据 库 中 的 表 项 
Let : WHT Tp : 
amazon: 1678 ie, 2 
ebay: 8734 : ”cookie 特定 访问 
re 
ii : 
: WHT Tp: : 访问 
ow Cookie. OR x A 
amazon: 1678 : cookie 特定 
: wT u A 
: ; 
时 间 时 间 


图 例 : 
cookie 文 件 
2-10 用 cookie 跟踪 用 户 状 态 


如 果 Susan 再 次 访问 Amazon 站 点 ， 比 如 说 一 个 星期 后 ， 她 的 浏览 器 会 在 其 请 求 报 文 
中 继续 放 入 首部 行 cookie; 1678, Amazon 将 根据 Susan 过 去 在 Amazon 访问 的 网 页 向 她 推 
荐 产品 。 如 果 Susan 也 在 Amazon 注册 过 ， 即 提供 了 她 的 全 名 、 电 子 邮 件 地 址 、 邮 政 地 址 
和 信用 卡 账号 ， 则 Amazon 能 在 其 数据 库 中 包括 这 些 信息 ， 将 Susan 的 名 字 与 识别 码 相 关 
联 ( 以 及 她 在 过 去 访问 过 的 本 站 点 的 所 有 页 面 )。 这 就 解释 了 Amazon 和 其 他 一 些 电子 商 
务 网 站 实现 “点 击 购物 ”(one-cjlick shopping) 的 道理 ， 即 当 Susan 在 后 继 的 访问 中 选择 购 
买 某 个 物品 时 ， 她 不 必 重 新 输入 姓名 、 信 用 卡 账号 或 者 地 址 等 信息 了 。 

从 上 述 讨论 中 我 们 看 到 ，cookie 可 以 用 于 标识 一 个 用 户 。 用 户 首次 访问 一 个 站 点 时 ， 可 
能 需要 提供 一 个 用 户 标识 〈 可 能 是 名 字 ) 。 在 后 继 会 话 中 ， 浏 览 器 向 服务 器 传递 一 个 cookie 
首部 ， 从 而 向 该 服务 器 标识 了 用 户 。 因 此 cookie 可 以 在 无 状态 的 HTTP 之 上 建立 一 个 用 户 会 
话 层 。 例 如 ， 当 用 户 向 一 个 基于 Web 的 电子 邮件 系统 (如 Hotmail) 注册 时 ， 浏 览 器 向 服务 
器 发 送 cookie 信息 ， 人 允许 该 服务 器 在 用 户 与 应 用 程序 会 话 的 过 程 中 标识 该 用 户 。 
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尽管 cookie 常常 能 简化 用 户 的 因特网 购物 活动 ， 但 是 它 的 使 用 仍 具 有 争议 ， 因 为 它们 
被 认为 是 对 用 户 隐 私 的 一 种 侵害 。 如 我 们 刚才 所 见 ， 结 合 cookie 和 用 户 提供 的 账户 信息 ， 
Web 站 点 可 以 知道 许多 有 关 用 户 的 信息 ， 并 可 能 将 这 些 信息 卖 给 第 三 方 。Cookie Central 
[ Cookie Central 2016] 包括 了 对 cookie 争论 的 广泛 信息 。 


2.2.5 Web 缓存 


Web 44785 (Web cache) 也 叫 代理 
服务 器 (proxy server) ， 它 是 能 够 代表 初 
始 Web 服务 器 来 满足 HTTP 请 求 的 网 络 实 
体 。Web 缓存 器 有 自己 的 磁盘 存储 空间 ， 
并 在 存储 空间 中 保存 最 近 请 求 过 的 对 象 的 
副本 。 如 图 2-11 所 示 ， 可 以 配置 用 户 的 浏 
览 器 ,使 得 用 户 的 所 有 HTTP 请 求 首先 指 
向 Web 缓存 器 。 一 旦 某 浏览 器 被 配置 ， 每 
个 对 某 对 象 的 浏览 句 请 求 首 先 被 定向 到 该 
Web 缓存 器 。 举 例 来 说 ， 假 设 浏览 器 正在 
请 求 对 象 http://www. someschool. edu/ 
campus. gif， 将 会 发 生 如 下 情况 : 2-11 客户 通过 Web 缓存 器 请 求 对 象 

1) 浏览 需 创 建 一 个 到 Web 缓存 器 
的 TCP 连接 ， 并 向 Web 缓存 器 中 的 对 象 发 送 一 个 HTTP 请 求 。 

2) Web 缓存 器 进行 检查 ， 看 看 本 地 是 否 存 储 了 该 对 象 副本 。 如 果 有 ，Web 缓存 器 就 
向 客户 浏览 器 用 HTTP 响应 报 文 返回 该 对 象 。 

3) 如 果 Web 缓存 器 中 没有 该 对 象 ， 它 就 打开 一 个 与 该 对 象 的 初始 服务 器 (BD 
www. someschool. edu) 的 TCP 连接 。Web 缓存 融 则 在 这 个 缓存 器 到 服务 器 的 TCP 连接 上 发 
送 一 个 对 该 对 象 的 HTTP 请 求 。 在 收 到 该 请 求 后 ， 初 始 服务 器 向 该 Web 缓存 器 发 送 具 有 该 
对 象 的 HTTP 响应 。 

4) 当 Web 缓存 髓 接收 到 该 对 象 时 ， 它 在 本 地 存储 空间 存储 一 份 副 本 ， 并 加 客户 的 浏览 
av HTTP 啊 应 报 文 发 送 该 副本 (通过 现 有 的 客户 浏览 锅 和 Web FF ah Z la] Hy TCP 连接 ) 。 

值得 注意 的 是 Web RH AEM tt MBP. SE BEM A ae AY TOR IF AZ e e iy 
时 ， 它 是 一 个 服务 器 。 当 它 同 初始 服务 器 发 出 请 求 并 接收 啊 应 时 ， 它 是 一 个 客户 。 

Web 缓存 器 通常 由 ISP 购买 并 安装 。 例 如 ， 一 所 大 学 可 能 在 它 的 校园 网 上 安装 一 台 组 
存 器 ， 并 且 将 所 有 校园 网 上 的 用 户 浏览 器 配置 为 指向 它 。 或 者 ， 一 个 主要 的 住宅 ISP (fil 
如 Comcast) 可 能 在 它 的 网 络 上 安装 一 台 或 多 台 Web 缓存 器 ， 并 且 预 先 配置 其 配套 的 浏览 
Arde [i] x LO AE AE o 

在 因特网 上 部 署 Web 缓存 器 有 两 个 原因 。 首 先 ，Web 缓存 器 可 以 大 大 减少 对 客户 请 
求 的 啊 应 时 间 ， 特 别 是 当 客户 与 初始 服务 器 之 间 的 瓶颈 带宽 远 低 于 客户 与 Web 缓存 器 之 
间 的 瓶颈 带宽 时 更 是 如 此 。 如 果 在 客户 与 Web 缓存 器 之 间 有 一 个 高 速 连接 (情况 常常 如 
此 ) ， 并 且 如 果 用 户 所 请 求 的 对 象 在 Web 缓存 器 上 ， 则 Web 缓存 器 可 以 迅速 将 该 对 象 交付 
给 用 户 。 其 次 ， 如 我 们 马上 用 例子 说 明 的 那样 ，Web 缓存 器 能 够 大 大 减少 一 个 机 构 的 接 人 
链 路 到 因特网 的 通信 量 。 通 过 减少 通信 量 ， 该 机 构 (如 一 家 公司 或 者 一 所 大 学 ) 就 不 必 急 
于 增加 带宽 ， 因 此 降低 了 费用 。 此 外 ，Web 缓存 器 能 从 整体 上 大 大 减低 因特网 上 的 Web 





流量 ， 从 而 改善 了 所 有 应 用 的 性 能 。 


为 了 深刻 理解 缓存 器 带 来 的 好 处 ， 我 们 考虑 在 图 2-12 场景 下 的 一 个 例子 。 该 图 显示 
了 两 个 网 络 ， 即 机 构 ( 内 部 ) 网 络 和 公共 因特网 的 一 部 分 。 机 构 网 络 是 一 个 高 速 的 局 域 网 ， 
它 的 一 台 路 由 顺 与 因特网 上 的 一 台 路 由 融通 过 一 条 15Mbps AYER ET. HER AMRF EG 


因特网 相连 但 位 于 全 世界 各 地 。 假 设 对 象 的 平均 长 
度 为 1Mb， 从 机 构 内 的 浏览 吉 对 这 些 初始 服务 需 的 
平均 访问 速率 为 每 秒 15 个 请 求 。 假 设 HTTP 请 求 
报 文 小 到 可 以 忽略 ， 因 而 不 会 在 网 络 中 以 及 接 入 链 
路 〈 从 机 构 内 部 路 由 器 到 因特网 路 由 器 ) 上 产生 什 
么 通信 量 。 我 们 还 假设 在 图 2-12 中 从 因特网 接 入 链 
路 一 侧 的 路 由 器 转发 HTTP 请 求 报 文 (在 一 个 全数 
据 报 中 ) 开始 ， 到 它 收 到 其 响应 报 文 (通常 在 多 个 
IP 数据 报 中 ) 为 止 的 时 间 平 均 为 2 秒 。 我 们 非 正 式 
地 将 该 持续 时 延 称 为 “因特网 时 延 ”。 

总 的 响应 时 间 ， 即 从 浏览 融 请 求 一 个 对 象 到 接 
收 到 该 对 象 为 止 的 时 间 ， 是 局 域 网 时 延 、 接 入 时 延 
( 即 两 台 路 由 器 之 间 的 时 延 ) 和 因特网 时 延 之 和 。 
我 们 来 粗略 地 估算 一 下 这 个 时 延 。 局 域 网 上 的 流量 
强度 (参见 1.4.2 市 ) 为 
(15 个 请 求 /s) x (1Mb/ 请 求 )/(100Mbps) = 0.15 

然而 接 入 链 路 上 的 流量 强度 (从 因特网 路 由 各 
BSL PR Ar) 为 

(15 个 请 求 /s) x (1Mb/ K )/(15Mbps) = 1 
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图 2-12 一 个 机 构 网 络 与 因特网 之 间 的 瓶颈 


局 域 网 上 强度 为 0. 15 的 通信 量 通 常 最 多 导致 数 十 毫秒 的 时 延 ， 因 此 我 们 可 以 忽略 局 


域 网 时 延 。 然 而 ， 如 在 1.4.2 节 讨 论 的 那样 ， 如 果 
流量 强度 接近 1 ( 就 像 在 图 2-12 中 接 入 链 路 的 情 
况 那 样 )， 链 路 上 的 时 延 会 变 得 非常 大 并 且 无 限 增 
长 。 因 此 ， 满 足 请 求 的 平均 啊 应 时 间 将 在 分 钟 的 
量 级 上 。 显 然 ， 必 须 想 办 法 来 改进 时 间 啊 应 特性 。 

一 个 可 能 的 解决 办 法 就 是 增加 接 人 链 路 的 速率 ， 
如 从 1SMbps 增加 到 100Mbps。 这 可 以 将 接 入 链 路 上 
的 流量 强度 减少 到 0. 15， 这 样 一 来 ， 两 台 路 由 需 之 
间 的 链 路 时 延 也 可 以 忽略 了 。 这 时 ， 总 的 啊 应 时 间 
将 大 约 为 2 秒 ， 即 为 因特网 时 延 。 但 这 种 解决 方案 
也 意味 着 该 机 构 必须 将 它 的 接 人 链 路 由 15Mbps 升级 
为 100Mbps， 这 是 一 种 代价 很 高 的 方案 。 

现在 来 考虑 另 一 种 解决 方案 ， 即 不 升级 链 路 
带宽 而 是 在 机 构 网 络 中 安装 一 个 Web RA AE. XK 
种 解决 方案 如 图 2-13 所 示 。 实 践 中 的 命中 率 (BP 
由 一 个 缓存 器 所 满足 的 请 求 的 比率 ) 通常 在 0.2 ~ 
0.7 之 间 。 为 了 便于 阐述 ， 我 们 假设 该 机 构 的 缓存 
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15Mbps 接 入 链 路 
”R100Mbps 局 域 网 


图 2-13 为 机 构 网 络 添加 一 台 缓 存 融 
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命中 率 为 0.4。 因 为 客户 和 缓存 连接 在 一 个 相同 的 高 速 局 域 网 上 上， 这样 40% 的 请 求 将 几乎 
立即 会 由 缓存 器 得 到 响应 ， 时 延 约 在 10ms WA. Ai, BPA 60% 的 请 求 仍 然 要 由 初始 
服务 器 来 满足 。 但 是 只 有 60% 的 被 请 求 对 象 通过 接 人 链 路 ， 在 接 人 链 路 上 的 流量 强度 从 
1.0 减 小 到 0.6。 一 般 而 言 ， 在 15Mbps 链 路 上 ， 当 流量 强度 小 于 0.8 时 对 应 的 时 延 较 小 ， 
约 为 几 十 上 毫秒。 这 个 时 延 与 2 秒 因特网 时 延 相 比 是 微不足道 的 。 考 虑 这 些 之 后 ， 平 均 时 延 
因此 为 
0.4 x(0.010 秒 ) +0.6 x (2.01 #) 

这 略 大 于 1.2 秒 。 因 此 ， 第 二 种 解决 方案 提供 的 响应 时 延 甚 至 比 第 一 种 解决 方案 更 
低 ， 也 不 需要 该 机 构 升 级 它 到 因特网 的 链 路 。 该 机 构 理所当然 地 要 购买 和 安装 Web RF 
器 。 除 此 之 外 其 成 本 较 低 ， 很 多 缓存 器 使 用 了 运行 在 廉价 PC 上 的 公共 域 软件 。 

通过 使 用 内 容 分 发 网 络 ( Content Distribution Network, CDN), Web 缓存 器 正在 因特网 
中 发 挥 着 越 来 越 重要 的 作用 。CDN 公司 在 因特网 上 安装 了 许多 地 理 上 分 散 的 缓存 器 ， 因 而 
使 大 量 流量 实现 了 本 地 化 。 有 多 个 共享 的 CDN (例如 Akamai 和 Limelight) 和 专用 的 CDN 
(例如 谷歌 和 Netflix) 。 我 们 将 在 2. 6 节 中 更 为 详细 地 讨论 CDN, 


2.2.6 条 件 GET 方法 


尽管 高 速 缓存 能 减少 用 户 感受 到 的 响应 时 间 ， 但 也 引 人 了 一 个 新 的 问题 ， 即 存放 在 组 
存 器 中 的 对 象 副本 可 能 是 陈旧 的 。 换 句 话 说， 保存 在 服务 器 中 的 对 象 自 该 副本 缓存 在 客户 
上 以 后 可 能 已 经 被 修改 了 。 幸 运 的 是 ，HTTP 协议 有 一 种 机 制 ， 人 允许 缓存 器 证 实 它 的 对 象 
是 最 新 的 。 这 种 机 制 就 是 条 件 GET (conditional GET) 方法 。 如 果 : 中 请 求 报 文 使 用 CET 
方法 ; 并 且 @ 请 求 报 文中 包含 一 个 “If- Modified- Since:” 首 部 行 。 那 么 ， 这 个 HTTP 请 求 
报 文 就 是 一 个 条 件 GET 请 求 报 文 。 

为 了 说 明 GET 方法 的 操作 方式 ， 我们 看 一 个 例子 。 首 先 ， 一 个 代理 缓存 器 (proxy 
cache) 代表 一 个 请 求 浏览 器 ， 向 某 Web 服务 器 发 送 一 个 请 求 报 文 : 


GET /fruit/kiwi.gif HTTP/1.i 
Host: www.exotiquecuisine.com 


其 次 ,该 Web 服务 器 向 缓存 器 发 送 具 有 被 请 求 的 对 象 的 啊 应 报 文 : 


HTTP/1.1 200 OK 

Date: Sat; 3 Oct 2015 15:39:29 

Server: Apache/1.3.0 (Unix) 
Last-Modified: Wed, 9 Sep 2015 09:23:24 
Content-Type: image/gif 


(data data data data data ...) 


该 缓存 器 在 将 对 象 转发 到 请 求 的 浏览 器 的 同时 ， 也 在 本 地 缓存 了 该 对 象 。 重 要 的 是 ， 
缓存 器 在 存储 该 对 象 时 也 存储 了 最 后 修改 日 期 。 最 后 ， 一 个 星期 后 ， 另 一 个 用 户 经 过 该 组 
存 器 请 求 同 一 个 对 象 ， 该 对 象 仍 在 这 个 缓存 器 中 。 由 于 在 过 去 的 一 个 星期 中 位 于 Web 服 
务 器 上 的 该 对 象 可 能 已 经 被 修改 了 ,该 缓存 器 通过 发 送 一 个 条 件 GET 执行 最 新 检查 。 具 
体 来 说 ， 该 缓存 器 发 送 : 


GET /fruit/kiwi.gif HTTP/1.1 
Host: www.exotiquecuisine.com 
If-modified-since: Wed, 9 Sep 2015 09:23:24 


值得 注意 的 是 Hf- Modified-Since: 首部 行 的 值 正 好 等 于 一 星期 前 服务 器 发 送 的 啊 应 报 文 


中 的 Last-Modified: 首部 行 的 值 。 该 条 件 CET 报 文 告诉 服务 器 ， 仅 当 上 自 指 定 日 期 之 后 该 对 
象 被 修改 过 ， 才 发 送 该 对 象 。 假 设 该 对 象 自 2015 年 9 月 9 日 09: 23: 24 后 没有 被 修改 。 
接 下 来 的 第 四 步 ，Web 服务 器 回 该 缓存 器 发 送 一 个 响应 报 文 : 


HTTP/1.1 304 Not Modified 
Date: Sat, 10 Oct 2015 15:39:29 
Server: Apache/1.3.0 (Unix) 


(empty entity body) 


我 们 看 到 ， 作 为 对 该 条 件 GET 方法 的 响应 ， 该 Web 服务 器 仍 发 送 一 个 响应 报 文 ， 但 
并 没有 在 该 响应 报 文 中 包含 所 请 求 的 对 象 。 包 含 该 对 象 只 会 浪费 带宽 ， 并 增加 用 户 感 受到 
的 响应 时 间 ， 特 别 是 如 果 该 对 象 很 大 的 时 候 更 是 如 此 。 值 得 注意 的 是 在 最 后 的 啊 应 报 文 
中 ， 状 态 行 中 为 304 Not Modified， 它 告诉 缓存 器 可 以 使 用 该 对 象 ， 能 向 请 求 的 浏览 器 转发 
它 〈 该 代理 缓存 器 ) 缓存 的 该 对 象 副本 。 

我 们 现在 完成 了 对 HTTP 的 讨论 ， 这 是 我 们 详细 学 习 的 第 一 个 因特网 协议 (应 用 层 协 
议 )。 我 们 已 经 学 习 了 HTTP 报 文 的 格式 ， 学 习 了 当 发 送 和 接收 这 些 报 文 时 Web 客户 和 服 
务 器 所 采取 的 动作 。 我 们 还 学 习 了 一 点 Web 应 用 程序 基础 设施 ， 包 括 缓存 、cookie 和 后 端 
数据 库 ， 所 有 这 些 都 以 某 种 方式 与 HTTP 协议 有 关 。 


2.3 因特网 中 的 电子 邮件 


自从 有 了 因特网 ， 电 子 邮件 就 在 因特网 上 流行 起 来 。 当 因特网 还 在 褪 宰 中 时 ， 电 子 邮 
件 已 经 成 为 最 为 流行 的 应 用 程序 [Segaller 1998 ] ， 年 复 一 年 ， 它 变 得 越 来 越 精细 ， 越 来 越 
强大 。 它 仍然 是 当今 因特网 上 最 重要 和 实用 的 应 用 程序 之 一 。 

与 普通 邮件 一 样 ， 电 子 邮 件 是 一 种 异步 通信 媒介 ， 即 当 人 们 方便 时 就 可 以 收发 邮件 ， 
不 必 与 他 人 的 计划 进行 协调 。 与 普通 邮件 相 比 ， 电 子 邮件 更 为 快速 并 且 易 于 分 发 ， 而 且 价 
格 便宜 。 现 代 电 子 邮 件 具 有 许多 强大 的 特性 ， 包 括 具 有 附件 、 超 链接 、HTML 格式 文本 和 
图 片 的 报 文 。 

在 本 节 中 ， 我们 将 讨论 位 于 因特网 电子 邮件 的 核心 地 位 的 应 用 层 协议 。 在 深入 讨论 
些 应 用 层 协 议 之 前 ， 我们 先 总 体 上 看 看 因特网 电子 邮件 系统 和 它 的 关键 组 件 。 

图 2-14 给 出 了 因特网 电子 邮件 系统 的 总 体 情况 。 从 该 图 中 我 们 可 以 看 到 它 有 3 
个 主要 组 成 部 分 : 用 户 代 理 (user agent) 、 邮 件 服务 器 (mail server) 和 简单 邮件 传输 
协议 (Simple Mail Transfer Protocol ，SMTP ) 。 下 面 我 们 结合 发 送 方 Alice 发 电子 邮件 给 
接收 方 Bob 的 场景 ， 对 每 个 组 成 部 分 进行 描述 。 用 户 代 理 允许 用 户 阅 读 、 回 复 、 转 
发 、 保 存 和 撰写 报 文 。 微 软 的 Outlook 和 Apple Mail 是 电子 邮件 用 户 代理 的 例子 。 当 
Alice 完成 邮件 撰写 时 ， 她 的 邮件 代理 回 其 邮件 服务 器 发 送 邮件 ， 此 时 邮件 放 在 邮件 
服务 器 的 外 出 报 文 队列 中 。 当 Bob 要 阅读 报 文 时 ， 他 的 用 户 代理 在 其 邮件 服务 器 的 邮 
箱 中 取得 该 报 文 。 

邮件 服务 器 形成 了 电子 邮件 体系 结构 的 核心 。 每 个 接收 方 (如 Bob) 在 其 中 的 某 个 邮 
件 服务 器 上 有 一 个 邮箱 (mailbox), Bob 的 邮箱 管理 和 维护 着 发 送 给 他 的 报 文 。 一 个 典型 
的 邮件 发 送 过 程 是 : 从 发 送 方 的 用 户 代 理 开 始 ， 传 输 到 发 送 方 的 邮件 服务 器 ， 再 传输 到 接 
收 方 的 邮件 服务 器 ， 然 后 在 这 里 被 分 发 到 接收 方 的 邮箱 中 。 当 Bob 要 在 他 的 邮箱 中 读 取 该 
报 文 时 ， 包 含 他 邮箱 的 邮件 服务 器 (使 用 用 户 名 和 口令 ) 来 鉴别 Bob。Alice 的 邮箱 也 必 


须 能 处 理 Bob 的 邮件 服务 器 的 故障 。 如 果 Alice 的 服务 器 不 能 将 邮件 交付 给 Bob 的 服务 器 ， 
Alice 的 邮件 服务 器 在 一 个 报 文 队 列 (message queue) 中 保持 该 报 文 并 在 以 后 尝试 再 次 发 
送 。 通 常 每 30 分 钟 左右 进行 一 次 尝试 ; 如 果 几 天 后 仍 不 能 成 功 ， 服 务 硕 就 删除 该 报 文 并 
以 电子 邮件 的 形式 通知 发 送 方 (Alice ) 。 
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图 例 : 
ANN 外 出 报 文 队列 用 户 邮箱 
图 2-14 ”因特网 电子 邮件 系统 的 总 体 描述 


SMTP 是 因特网 电子 邮件 中 主要 的 应 用 层 协议 。 它 使 用 TCP 可 靠 数 据 传输 服务 ， 从 发 
送 方 的 邮件 服务 器 向 接收 方 的 邮件 服务 器 发 送 邮 件 。 像 大 多 数 应 用 层 协议 一 样 ，SMTP 也 
有 两 个 部 分 : 运行 在 发 送 方 邮件 服务 器 的 客户 端 和 运行 在 接收 方 邮件 服务 器 的 服务 器 端 。 
每 台 邮 件 服务 器 上 既 运 行 SMTP 的 客户 端 也 运行 SMTP 的 服务 器 端 。 当 一 个 邮件 服务 器 向 
其 他 邮件 服务 器 发 送 邮件 时 ， 它 就 表现 为 SMTP 的 客户 ; 当 邮 件 服务 器 从 其 他 邮件 服务 器 
上 接收 邮件 时 ， 它 就 表现 为 一 个 SMTP 的 服务 器 。 


2.3.1 SMTP 


RFC 5321 给 出 了 SMTP 的 定义 。SMTP 是 因特网 电子 邮件 的 核心 。 如 前 所 述 ， 
SMTP 用 于 从 发 送 方 的 邮件 服务 器 发 送 报 文 到 接收 方 的 邮件 服务 器 。SMTP 问世 的 时 
间 比 HTTP 要 长 得 多 (初始 的 SMTP 协议 的 RFC 可 追溯 到 1982 年 ， 而 SMTP 在 此 之 前 
很 长 一 段 时 间 就 已 经 出 现 了 )。 尽 管 电子 邮件 应 用 在 因特网 上 的 独特 地 位 可 以 证 明 
SMTP 有 着 众多 非常 出 色 的 性 质 ， 但 它 所 具有 的 某 种 陈旧 特征 表明 它 仍 然 是 一 种 继承 
的 技术 。 例 如 ， 它 限制 所 有 邮件 报 文 的 体 部 分 (不 只 是 其 首部 ) 只 能 采用 简单 的 7 比 
特 ASCII 表示 。 在 20 世纪 80 年 代 早期 ， 这 种 限制 是 明智 的 ， 因 为 当时 传输 能 力 不 
足 ， 没 有 人 会 通过 电子 邮件 发 送 大 的 附件 或 是 大 的 图 片 、 声 音 或 者 视频 文件 。 然 而 ， 
在 今天 的 多 媒体 时 代 ,，7 位 ASCII 的 限制 的 确 有 点 痛苦 ， 即 在 用 SMTP 传送 邮件 之 前 ， 
需要 将 二 进 制 多 媒体 数据 编码 为 ASCII 码 ， 并 且 在 使 用 SMTP 传输 后 要 求 将 相应 的 


ASCII 码 邮件 解码 还 原 为 多 媒体 数据 。2. 2 节 讲 过 ， 使 用 HTTP 传送 前 不 需要 将 多 媒 
体 数据 编码 为 ASCH 码 。 

为 了 描述 SMTP 的 基本 操作 ， 我 们 观察 一 种 常见 的 情景 。 假 设 Alice 想 给 Bob 发 送 一 
Ef fay LAY ASCII 报 文 。 

1) Alice 调用 她 的 邮件 代理 程序 并 提供 Bob 的 邮件 地 址 (例如 bob@ someschool. edu) , 
撰写 报 文 ， 然 后 指示 用 户 代理 发 送 该 报 文 。 

2) Alice 的 用 户 代 理 把 报 文 发 给 她 的 邮件 服务 器 ， 在 那里 该 报 文 被 放 在 报 文 队列 中 。 

3) 运行 在 Alice 的 邮件 服务 器 上 的 SMTP 客户 端 发 现 了 报 文 队列 中 的 这 个 报 文 ， 它 就 
创建 一 个 到 运行 在 Bob 的 邮件 服务 器 上 的 SMTP 服务 器 的 TCP 连接 。 

4) 在 经 过 一 些 初始 SMTP 握手 后 ，SMTP 客户 通过 该 TCP 连接 发 送 Alice 的 报 文 。 

5) 在 Bob 的 邮件 服务 右上 ，SMTP 的 服务 器 端 接收 该 报 文 。Bob 的 邮件 服务 器 然后 将 
该 报 文 放 和 Bob 的 邮箱 中 。 

6) Æ Bob 方便 的 时 候 ， 他 调用 用 户 代 理 阅 读 该 报 文 。 

图 2-15 总 结 了 上 述 这 个 情况 。 





图 例 : 


RN 团 用 户 邮 箱 
图 2-15 Alice ji] Bob 发 送 一 条 报 文 


观察 到 下 述 现象 是 重要 的 : SMTP 一 般 不 使 用 中 间 邮 件 服务 器 发 送 邮件 ， 即 使 这 两 个 
邮件 服务 器 位 于 地 球 的 两 端 也 是 这 样 。 假 设 Alice 的 邮件 服务 器 在 中 国 香港 ， 而 Bob 的 服 
务 器 在 美国 圣路易斯 ， 那 么 这 个 TCP 连接 也 是 从 香港 服务 器 到 圣路易斯 服务 器 之 间 的 直接 
相连 。 特 别 是 ， 如 果 Bob 的 邮件 服务 器 没有 开机 ， 该 报 文 会 保留 在 Alice 的 邮件 服务 器 上 
并 等 待 进行 新 的 尝试 ， 这 意味 着 邮件 并 不 在 中 间 的 某 个 邮件 服务 右 存 留 。 

我 们 现在 仔细 观察 一 下 ，SMTP 是 如 何 将 一 个 报 文 从 发 送 邮 件 服务 器 传送 到 接收 
邮件 服务 器 的 。 我 们 将 看 到 ，SMTP 与 人 类 面对面 交往 的 行为 方式 有 许多 类 似 性 。 首 
先 ， 客 户 SMTP (运行 在 发 送 邮件 服务 器 主机 上 ) 在 25 号 端口 建立 一 个 到 服务 器 
SMTP (运行 在 接收 邮件 服务 器 主机 上 ) 的 TCP 连接 。 如 果 服 务 器 没有 开机 ， 客 户 会 
在 稍 后 继续 尝试 连接 。 一 旦 连接 建立 ， 服 务 器 和 客户 执行 某 些 应 用 层 的 握手 ， 就 像 人 
们 在 互相 交流 前 先进 行 自 我 介绍 一 样 。SMTP 的 客户 和 服务 器 在 传输 信息 前 先 相 互 介 
绍 。 在 SMTP 握手 的 阶段 ，SMTP 客户 指示 发 送 方 的 邮件 地 址 (产生 报 文 的 那个 人 ) 
和 接收 方 的 邮件 地 址 。 一 旦 该 SMTP 客户 和 服务 器 彼此 介绍 之 后 ， 客 户 发 送 该 报 文 。 
SMTP 能 依赖 TCP 提供 的 可 靠 数 据 传输 无 差错 地 将 邮件 投递 到 接收 服务 器 。 该 客户 如 
果 有 另外 的 报 文 要 发 送 到 该 服务 器 ， 就 在 该 相同 的 TCP 连接 上 重复 这 种 处 理 ; 否则 ， 
它 指示 TCP 关闭 连接 。 
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接 下 来 我 们 分 析 一 个 在 SMTP 客户 (C) 和 SMTP 服务 器 (S) 之 间 交 换 报 文 文本 的 例 
子 。 客 户 的 主机 名 为 crepes. fr, ARS 45H) EPL A hamburger. edu, LAC: 开头 的 ASCII 码 
文本 行 正 是 客户 交 给 其 TCP 套 接 字 的 那些 行 ， 以 S$: 开头 的 ASCI 码 则 是 服务 器 发 送 给 其 
TCP 套 接 字 的 那些 行 。 一 旦 创建 了 TCP 连接 ， 就 开始 了 下 列 过 程 。 


Do you like ketchup? 
How about pickles? 


250 Message accepted for delivery 
QUIT 
221 hamburger.edu closing connection 


S: 220 hamburger.edu 

C: HELO crepes.fr 

S: 250 Hello crepes.fr, pleased to meet you 
C: MAIL FROM: <alice@crepes.fr> 

S: 250 alice@crepes.fr ... Sender ok 

C: RCPT TO: <bob@hamburger.edu> 

S: 250 bob@hamburger.edu ... Recipient ok 
Cs DATA 

S: 354 Enter mail, end with ”.” on a line by itself 
Cs 

Gs 

Cs 

S: 

Cs 

S: 


在 上 例 中 ， 客 户 从 邮件 服务 器 crepes. fr 向 邮件 服务 器 hamburger. edu 发 送 了 一 个 报 文 
( “Do you like ketchup? How about pickles?”) 。 作 为 对 话 的 一 部 分 ， 该 客户 发 送 了 5 条 命 
令 : HELO (是 HELLO 的 缩写 ) MAIL FROM, RCPT TO, DATA 以 及 QUIT。 这 些 命令 都 
是 目 解释 的 。 该 客户 通过 发 送 一 个 只 包含 一 个 句点 的 行 ， 向 服务 器 指示 该 报 文 结 束 了 。 
(按照 ASCI 码 的 表示 方法 ， 每 个 报 文 以 CRLF. CRLF 结束 ， 其 中 的 CR 和 LF 分 别 表示 回 
车 和 换行 。) 服务 器 对 每 条 命令 做 出 回答 ， 其 中 每 个 回答 含有 一 个 回答 码 和 一 些 (可 选 
的 ) 英文 解释 。 我 们 在 这 里 指出 SMTP 用 的 是 持续 连接 : 如 果 发 送 邮 件 服 务 器 有 几 个 报 文 
发 往 同 一 个 接收 邮件 服务 器 ， 它 可 以 通过 同一 个 TCP 连接 发 送 这 些 所 有 的 报 文 。 对 每 个 报 
文 ， 该 客户 用 一 个 新 的 MAIL FROM; crepes. fr 开始 ， 用 一 个 独立 的 句点 指示 该 邮件 的 结 
束 ， 并 且 仅 当 所 有 邮件 发 送 完 后 才 发 送 QUIT。 

我 们 强烈 推荐 你 使 用 Telnet 与 一 个 SMTP 服务 器 进行 一 次 直接 对 话 。 使 用 的 命令 是 


telnet serverName 25 


其 中 serverName 是 本 地 邮件 服务 器 的 名 称 。 当 你 这 么 做 时 ， 就 直接 在 本 地 主机 与 邮件 
服务 器 之 间 建 立 一 个 TCP 连接 。 输 完 上 述 命令 后 ， 你 立即 会 从 该 服务 器 收 到 220 回答 。 接 
下 来 ,在 适当 的 时 机 发 出 HELO, MAIL FROM, RCPT TO, DATA, CRLF. CRLF 以 及 QUIT 
等 SMTP 命令 。 强 烈 推 荐 你 做 本 章 后 面 的 编程 作业 3。 在 该 作业 中 ， 你 将 在 SMTP 的 客户 
端 实现 一 个 简单 的 用 户 代 理 ， 它 允许 你 经 本 地 邮件 服务 器 向 任意 的 接收 方 发 送 电子 邮件 
报 文 。 


2.3.2 5 HTTP 的 对 比 


我 们 简要 地 比较 一 下 SMTP 和 HTTP。 这 两 个 协议 都 用 于 从 一 台 主 机 向 男 一 台 主 机 传 
送 文件 : HTTP 从 Web 服务 器 加 Web 客户 (通常 是 一 个 浏览 器 ) 传送 文件 (也 称 为 对 
ZR); SMTP 从 一 个 邮件 服务 器 向 男 一 个 邮件 服务 器 传送 文件 ( 即 电 子 邮件 报 文 )。 当 进行 
文件 传送 时 ， 持 续 的 HTTP Al SMTP 都 使 用 持续 连接 。 因 此 ， 这 两 个 协议 有 一 些 共同 特征 。 
然而 ， 两 者 之 间 也 有 一 些 重要 的 区 别 。 首 先 ，HTTP 主要 是 一 个 拉 协 议 (pull protocol), 
即 在 方便 的 时 候 ， 某 些 人 在 Web 服务 器 上 装载 信息 ， 用 户 使 用 HTTP 从 该 服务 器 拉 取 这 些 
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信息 。 特 别 是 TCP 连接 是 由 想 接收 文件 的 机 器 发 起 的 。 另 一 方面 ，SMTP 基本 上 是 一 个 推 
协议 (push protocol) ， 即 发 送 邮件 服务 器 把 文件 推 向 接收 邮件 服务 器 。 特 别 是 ， 这 个 TCP 
连接 是 由 要 发 送 该 文件 的 机 器 发 起 的 。 

第 二 个 区 别 就 是 我 们 前 面 间接 地 提 到 过 的 ，SMTP 要 求 每 个 报 文 (包括 它们 的 体 ) 采 
用 7 比特 ASCII 码 格 式 。 如 果 某 报 文 包 含 了 非 7 比特 ASCH 字符 (如 具有 重音 的 法 文字 
符 ) 或 二 进 制 数 据 (如 图 形 文 件 ) ， 则 该 报 文 必须 按照 7 比特 ASCII 码 进行 编码 。HTTP 数 
据 则 不 受 这 种 限制 。 

第 三 个 重要 区 别 是 如 何 处 理 一 个 既 包 含 文本 又 包含 图 形 (也 可 能 是 其 他 媒体 类 型 ) 的 
文档 。 如 我 们 在 2. 2 节 知 道 的 那样 ，HTTP 把 每 个 对 象 封装 到 它 自 己 的 HTTP 响应 报 文中 ， 
而 SMTP 则 把 所 有 报 文 对 象 放 在 一 个 报 文 之 中 。 


2.3.3 邮件 报 文 格 式 


当 Alice 给 Bob 写 一 封 邮寄 时 间 很 长 的 普通 信件 时 ， 她 可 能 要 在 信 的 上 部 包含 各 种 各 
样 的 环境 首部 信息 ， 如 Bob 的 地 址 、 她 自己 的 回复 地 址 以 及 日 期 等 。 同 样 ， 当 一 个 人 给 男 
一 个 人 发 送 电子 邮件 时 ， 一 个 包含 环境 信息 的 首部 位 于 报 文 体 前 面 。 这 些 环境 信息 包括 在 
一 系列 首部 行 中 ， 这 些 行 由 RFC 5322 定义 。 首 部 行 和 该 报 文 的 体 用 空 行 ( 即 回 车 换行 ) 
进行 分 隔 。RFC 5322 定义 了 邮件 首部 行 和 它们 的 语义 解释 的 精确 格式 。 如 同 HTTP 协议 ， 
每 个 首部 行 包 含 了 可 读 的 文本 ， 是 由 关键 词 后 跟 冒 号 及 其 值 组 成 的 。 某 些 关 键 词 是 必需 
的 ， 另 一 些 则 是 可 选 的 。 每 个 首部 必须 含有 一 个 From: 首部 行 和 一 个 To: 首部 行 ; 一 个 
首部 也 许 包 含 一 个 Subject: 首部 行 以 及 其 他 可 选 的 首部 行 。 重 要 的 是 注意 到 下 列 事实 : 这 
些 首 部 行 不 同 于 我 们 在 2.3. 1 节 所 学 到 的 SMTP 命令 〈 即 使 那里 包含 了 某 些 相同 的 词汇 ， 
如 from 和 to)。 那 节 中 的 命令 是 SMTP 握手 协议 的 一 部 分 ; 本 节 中 考察 的 首部 行 则 是 邮件 
报 文 自身 的 一 部 分 。 

一 个 典型 的 报 文 首部 看 起 来 如 下 : 


From: alice@crepes.fr 
To: bob@hamburger.edu 
Subject: Searching for the meaning of life. 


在 报 文 首部 之 后 ， 紧 接着 一 个 空白 行 ， 然 后 是 以 ACS 格式 表示 的 报 文 体 。 你 应 当 用 
Telnet 向 邮件 服务 器 发 送 包 含 一 些 首 部 行 的 报 文 ， 包 括 Subject: 首部 行 。 为 此 ， 输 入 命令 
telnet serverName 25, ， 如 在 2. 3. 1 节 中 讨论 的 那样 。 


2.3.4 邮件 访问 协议 


— H SMTP 将 邮件 报 文 从 Alice 的 邮件 服务 器 交付 给 Bob 的 邮件 服务 器 ， 该 报 文 就 被 
WAT Bob 的 邮箱 中 。 在 此 讨论 中 ,我 们 按 惯 例假 定 Bob 是 通过 登录 到 服务 器 主机 ， 并 直 
接 在 该 主机 上 运行 一 个 邮件 阅读 程序 来 阅读 他 的 邮件 的 。 直 到 20 世纪 90 年 代 早期 ， 这 都 
是 一 种 标准 方式 。 而 在 今天 ， 邮 件 访问 使 用 了 一 种 客户 -服务 器 体系 结构 ， 即 典型 的 用 户 
通过 在 用 户 端 系统 上 运行 的 客户 程序 来 阅读 电子 邮件 ， 这 里 的 端 系 统 可 能 是 办 公 室 的 PC、 
便携 机 或 者 是 智能 手机 。 通 过 在 本 地 主机 上 运行 邮件 客户 程序 ， 用 户 享 受 一 系列 丰富 的 特 
性 ， 包 括 查 看 多 媒体 报 文 和 附件 的 能 力 。 

假设 Bob (接收 方 ) 在 其 本 地 PC 上 运行 用 户 代 理 程序 ， 考 虑 在 他 的 本 地 PC 上 也 
放置 一 个 邮件 服务 器 是 自然 而 然 的 事 。 在 这 种 情况 下 ，Alice 的 邮件 服务 器 就 能 直接 
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与 Bob 的 PC 进行 对 话 了 。 然 而 这 种 方法 会 有 一 个 问题 。 前 面 讲 过 邮件 服务 器 管理 用 
户 的 邮箱 ， 并 且 运 行 SMTP WA Pe AIRS Ah. WMR Bob 的 邮件 服务 闫 位 于 他 的 PC 
上 ， 那 么 为 了 能 够 及 时 接收 可 能 在 任何 时 候 到 达 的 新 邮件 ， 他 的 PC 必须 总 是 不 间断 
地 运行 着 并 一 直 保 持 在 线 。 这 对 于 许多 因特网 用 户 而 言 是 不 现实 的 。 相 反 ， 典 型 的 用 
户 通常 在 本 地 PC 上 运行 一 个 用 户 代 理 程 序 ， 而 它 访问 存储 在 总 是 保持 开机 的 共享 邮 
件 服 务 器 上 的 邮箱 。 该 邮件 服务 器 与 其 他 用 户 共 享 ， 并 且 通 常 由 用 户 的 ISP 进行 维护 
(如 大 学 或 公司 ) 。 

现在 我 们 考虑 当 从 Alice 向 Bob 发 送 一 个 电子 邮件 报 文 时 所 取 的 路 径 。 我 们 刚才 已 经 
知道 ， 在 沿 着 该 路 径 的 某 些 点 上 ， 需 要 将 电子 邮件 报 文 存放 在 Bob 的 邮件 服务 器 上 。 通 过 
让 Alice 的 用 户 代 理 直 接 向 Bob 的 邮件 服务 器 发 送 报 文 ， 就 能 够 做 到 这 一 点 。 这 能 够 由 
SMTP 来 完成 : 实际 上 ，SMTP 被 设计 成 将 电子 邮件 从 一 台 主 机 推 到 男 一 台 主 机 。 然 而 ， 通 
常 Alice 的 用 户 代 理 和 Bob 的 邮件 服务 器 之 间 并 没有 一 个 直接 的 SMTP 对 话 。 相 反 ， 如 
图 2-16 所 示 ，Alice 的 用 户 代 理 用 SMTP 将 电子 邮件 报 文 推 人 她 的 邮件 服务 器 ， 接 着 她 的 
邮件 服务 器 (作为 一 个 SMTP 客户 ) 再 用 SMTP 将 该 邮件 中 继 到 Bob 的 邮件 服务 器 。 为 什 
么 该 过 程 要 分 成 两 步 呢 ? 主要 是 因为 不 通过 Alice 的 邮件 服务 器 进行 中 继 ，Alice 的 用 户 代 
理 将 没有 任何 办 法 到 达 一 个 不 可 达 的 目的 地 接收 服务 器 。 通 过 首先 将 邮件 存放 在 自己 的 邮 
件 服务 器 中 ，Alice 的 邮件 服务 器 可 以 重复 地 尝试 向 Bob 的 邮件 服务 器 发 送 该 报 文 ， 如 每 
30 分 钟 一 次 ， 直 到 Bob 的 邮件 服务 器 变 得 运行 为 止 。( 并 且 如 果 Alice 的 邮件 服务 器 关机 ， 
她 则 能 向 系统 管理 员 进 行 申告 !) SMTP RFC 文档 定义 了 如 何 使 用 SMTP 命令 经 过 多 个 
SMTP 服务 器 进行 报 文 中 继 。 
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图 2-16 电子 邮件 协议 及 其 通信 实体 


但 是 对 于 该 难题 仍然 有 一 个 疏漏 的 环节 ! 像 Bob 这 样 的 接收 方 ， 是 如 何 通 过 运行 其 本 
地 PC 上 的 用 户 代 理 ， 获 得 位 于 他 的 某 ISP 的 邮件 服务 器 上 的 邮件 呢 ? 值得 注意 的 是 Bob 
的 用 户 代 理 不 能 使 用 SMTP 得 到 报 文 ， 因 为 取 报 文 是 一 个 拉 操 作 ， 而 SMTP 协议 是 一 个 推 
协议 。 通 过 引入 一 个 特殊 的 邮件 访问 协议 来 解决 这 个 难题 ， 该 协议 将 Bob 邮件 服务 器 上 的 
报 文 传送 给 他 的 本 地 PC。 目 前 有 一 些 流行 的 邮件 访问 协议 ， 包 括 第 三 版 的 邮局 协议 (Post 
Office Protocol— Version 3，POP3 ) 、 因 特 网 邮件 访问 协议 (Internet Mail Access Protocol, 
IMAP) 以 及 HTTP, 

图 2-16 总 结 了 应 用 于 因特网 电子 邮件 的 一 些 协 议 : SMTP 用 来 将 邮件 从 发 送 方 的 邮件 
服务 器 传输 到 接收 方 的 邮件 服务 器 ; SMTP 也 用 来 将 邮件 从 发 送 方 的 用 户 代 理 传送 到 发 送 
方 的 邮件 服务 器 。 如 POPS 这 样 的 邮件 访问 协议 用 来 将 邮件 从 接收 方 的 邮件 服务 器 传送 到 
接收 方 的 用 户 代 理 。 
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1. POPS 


POP3 是 一 个 极为 简单 的 邮件 访问 协议 ， 由 RFC 1939 进行 定义 。 文 档 RFC 1939 简短 
且 可 读 性 强 。 因 为 该 协议 非常 简单 ， 故 其 功能 相当 有 限 。 当 用 户 代理 (客户) 打开 了 一 个 
到 邮件 服务 器 (服务 器 ) 端口 110 上 的 TCP 连接 后 ，POP3 就 开始 工作 了 。 随 着 建立 TCP 
连接 ，POP3 按照 三 个 阶段 进行 工作 : 特许 (authorization) 、 事 务 处 理 以 及 更 新 。 在 第 一 个 
阶段 即 特 许 阶段 ， 用 户 代 理发 送 ( 以 明文 形式 ) 用 户 名 和 口令 以 鉴别 用 户 。 在 第 二 个 阶段 
即 事务 处 理 阶段 ， 用 户 代 理 取 回报 文 ; 同时 在 这 个 阶段 用 户 代 理 还 能 进行 如 下 操作 ， 对 报 
文 做 删除 标记 ， 取 消 报 文 删除 标记 ， 以 及 获取 邮件 的 统计 信息 。 在 第 三 个 阶段 即 更 新 阶 
段 ， 它 出 现在 客户 发 出 了 quit 命令 之 后 ， 目 的 是 结束 该 POPS 会 话 ; 这 时 ， 该 邮件 服务 器 
删除 那些 被 标记 为 删除 的 报 文 。 

在 POP3 的 事务 处 理 过 程 中 ， 用 户 代 理发 出 一 些 命令 ,服务器 对 每 个 命令 做 出 回答 。 
回答 可 能 有 两 种 : + OK (有 时 后 面 还 跟 有 服务 器 到 客户 的 数据 ) ， 被 服务 器 用 来 指示 前 面 
的 命令 是 正常 的 ，- 上 ERR， 被 服务 器 用 来 指示 前 面 的 命令 出 现 了 某 些 差错 。 

特许 阶段 有 两 个 主要 的 命令 : user < user name > 和 pass < password > 。 为 了 举例 说 明 
这 两 个 命令 ， 我 们 建议 你 直接 用 Telnet 登录 到 POP3 服务 器 的 110 端口 ， 然 后 发 出 这 两 个 
命令 。 假 设 邮 件 服 务 器 的 名 字 为 mailServer， 那 么 你 将 看 到 类 似 的 过 程 : 


telnet mailServer 110 

+OK POP3 server ready 

user bob 

+OK 

pass hungry 

+OK user successfully logged on 


如 果 你 的 命令 拼写 错 了 ,该 POP3 服务 器 将 返回 一 个 - ERR 报 文 。 

现在 我 们 来 看 一 下 事务 处 理 过 程 。 使 用 POP 的 用 户 代 理 通 常 被 用 户 配 置 为 “下 载 
并 删除 ”或 者 “下 载 并 保留 ”方式 。POP3 用 户 代 理发 出 的 命令 序列 取决 于 用 户 代理 程 
序 被 配置 为 这 两 种 工作 方式 的 哪 一 种 。 使 用 下 载 并 删除 方式 ， 用 户 代 理发 出 list、retr 和 
dele 命令 。 举 例 来 说 ,假设 用 户 在 他 (她 ) 的 邮箱 里 有 两 个 报 文 。 在 下 面 的 对 话 中 ， 
C: (代表 客户 ) 是 用 户 代 理 ，S: (代表 服务 器 ) 是 邮件 服务 器 。 事 务 处 理 过 程 将 类 似 
于 如 下 过 程 : 


i LES 


G4 

S> 1 498 

S$: 2 912 

ST r 

CG: retr 1 

S: {blah Dla ws 

SiS: gre wate eee mallee ipa as 
Se als sce ee blah) 

Si a 

C: dele 1 

Cs retr 2 

S: (blah blah 

Dy AG de pare T Oe ree. i 
SA Selena Seca blah) 
SE a 

C: dele 2 

Cs quit 

S: +OK POP3 server signing off 


用 户 代理 首先 请 求 邮件 服务 器 列 出 所 有 存储 的 报 文 的 长 度 。 接 着 用 户 代 理 从 邮件 服务 
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器 取 回 并 删除 每 封 邮件 。 注 意 到 在 特许 阶段 以 后 ， 用 户 代理 仅 使 用 四 个 命令 list, retr, de- 
le 和 quit， 这 些 命令 的 语法 定义 在 RFC 1939 中 。 在 处 理 quit 命令 后 ，POP3 服务 器 进入 更 
新 阶段 ， 从 用 户 的 邮箱 中 删除 邮件 1 和 2。 

使 用 下 载 并 删除 方式 存在 的 问题 是 ， 邮 件 接收 方 Bob 可 能 是 移动 的 ， 可 能 希望 从 多 个 
不 同 的 机 器 访问 他 的 邮件 报 文 ， 如 从 办 公 室 的 PC、 家 里 的 PC 或 他 的 便携 机 来 访问 邮件 。 
下 载 并 删除 方式 将 对 Bob 的 邮件 报 文 根 据 这 3 台 机 器 进行 划分 ， 特 别 是 如 果 Bob 最 先是 在 
他 办 公 室 的 PC 上 收取 了 一 条 邮件 ， 那么 晚上 当 他 在 家 里 时 ， 通 过 他 的 便携 机 将 不 能 青 收 
取 该 邮件 。 使 用 下 载 并 保留 方式 ， 用 户 代 理 下 载 某 邮 件 后 ， 该 邮件 仍 保留 在 邮件 服务 器 
上 。 这 时 ，Bob 就 能 通过 不 同 的 机 需 重 新 读 取 这 些 邮 件 ; 他 能 在 工作 时 收取 一 封 报 文 ， 而 
在 工作 回 家 后 再 次 访问 它 。 

在 用 户 代理 与 邮件 服务 器 之 间 的 POP3 会 话 期 间 ， 该 POP3 服务 器 保留 了 一 些 状 态 信 
息 ; 特别 是 记录 了 哪些 用 户 报 文 被 标记 为 删除 了 。 然而 ， POP3 服务 需 并 不 在 POP3 会 话 过 
程 中 携带 状态 信息 。 会 话 中 不 包括 状态 信息 大 大 简化 了 POP3 服务 的 实现 。 

2. IMAP 


使 用 POP3 访问 时 ,一 旦 Bob 将 邮件 下 载 到 本 地 主机 后 ， 他 就 能 建立 邮件 文件 夹 ， 
并 将 下 载 的 邮件 放 入 该 文件 夹 中 。 然 后 Bob 可 以 删除 报 文 ， 在 文件 夹 之 间 移 动 报 文 ， 
并 查询 报 文 (通过 发 送 方 的 名 字 或 报 文 主题 )。 但 是 这 种 文件 夹 和 报 文 存放 在 本 地 主 
机 上 的 方式 ， 会 给 移动 用 户 带 来 问题 ， 因 为 他 更 喜欢 使 用 一 个 在 远程 服务 郝 上 的 层次 
文件 夹 ， 这 样 他 可 以 从 任何 一 台 机 器 上 对 所 有 报 文 进行 访问 。 使 用 POP3 是 不 可 能 做 
到 这 一 点 的 ，POP3 协议 没有 给 用 户 提 供 任何 创建 远程 文件 夹 并 为 报 文 指派 文件 夹 的 
方法 

为 了 解决 这 个 或 其 他 一 些 问题 ， 由 RFC 3501 定义 的 因特网 邮件 访问 协议 
(IMAP) 应 运 而 生 。 和 POP3 一 样 ，IMAP 是 一 个 邮件 访问 协议 ， 但 是 它 比 POP3 具有 
更 多 的 特色 ， 不 过 也 比 POP3 复杂 得 多 。 (因此 客户 和 服务 器 端的 实现 也 都 复杂 
得 多 。) 

IMAP 服务 器 把 每 个 报 文 与 一 个 文件 夹 联系 起 来 ; 当 报 文 第 一 次 到 达 服 务 器 时 ， 它 
与 收 件 人 的 INBOX 文件 夹 相 关联 。 收 件 人 则 能 够 把 邮件 移 到 一 个 新 的 、 用 户 创建 的 文 
件 夹 中 ， 阅 读 邮 件 ， 删 除 邮 件 等 。IMAP 协议 为 用 户 提供 了 创建 文件 夹 以 及 将 邮件 从 一 
个 文件 夹 移动 到 另 一 个 文件 夹 的 命令 。IMAP 还 为 用 户 提 供 了 在 远程 文件 夹 中 查询 邮件 
的 命令 ， 按 指定 条 件 去 查询 匹配 的 邮件 。 值 得 注意 的 是 ， 与 POP3 不 同 ，IMAP 服务 需 
维护 了 IMAP 会 话 的 用 户 状态 信息 ， 例 如 ， 文 件 夹 的 名 字 以 及 哪些 报 文 与 哪些 文件 夹 相 
关联 。 

IMAP 的 另 一 个 重要 特性 是 它 具 有 人 允许 用 户 代理 获取 报 文 某 些 部 分 的 命令 。 例 如 ， 
个 用 户 代理 可 以 只 读 取 一 个 报 文 的 报 文 首 部 ， 或 只 是 一 个 多 部 分 MIME 报 文 的 一 部 分 。 
用 户 代理 和 其 邮件 服务 器 之 间 使 用 低 带 宽 连 接 (如 一 个 低速 调制 解 调 器 链 路 ) 的 时 候 ， 
个 特性 非常 有 用 。 使 用 这 种 低 带 宽 连 接 时 ， 用 户 可 能 并 不 想 取 回 他 邮箱 中 的 所 有 邮件 ， 
其 要 避免 可 能 包含 如 音频 或 视频 片断 的 大 邮件 。 

3. 基于 Web 的 电子 邮件 


今天 越 来 越 多 的 用 户 使 用 他 们 的 Web 浏览 器 收发 电子 邮件 。20 世纪 90 年 代 中 期 
Hotmail 引入 了 基于 Web 的 接 入 。 SR, 谷歌、 雅虎 以 及 几乎 所 有 重要 的 大 学 或 者 公 
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司 也 提供 了 基于 Web 的 电子 邮件 。 使 用 这 种 服务 ， 用 户 代 理 就 是 普通 的 浏览 器 ， 用 
户 和 他 远程 邮箱 之 间 的 通信 则 通过 HTTP 进行 。 当 一 个 收 件 人 (如 Bob), ， 想 从 他 的 
邮箱 中 访问 一 个 报 文 时 ， 该 电子 邮件 报 文 从 Bob 的 邮件 服务 器 发 送 到 他 的 浏览 器 ， 使 
用 的 是 HTTP 而 不 是 POP3 或 者 IMAP 协议 。 当 发 件 人 (如 Alice) 要 发 送 一 封 电 子 邮 
件 报 文 时 ， 该 电子 邮件 报 文 从 Alice 的 浏览 器 发 送 到 她 的 邮件 服务 器 ， 使 用 的 是 HTTP 
而 不 是 SMTP, m, Alice 的 邮件 服务 器 在 与 其 他 的 邮件 服务 器 之 间 发 送 和 接收 邮件 
时 ， 仍 然 使 用 的 是 SMTP。 


2.4 DNS: 因特网 的 目录 服务 


人 类 能 以 很 多 方式 来 标识 。 例 如 ， 我 们 能 够 通过 出 生 证 书 上 的 名 字 来 标识 ; 能 够 通过 
社会 保险 号 码 来 标识 ; 也 能 够 通过 驾驶 执照 上 的 号 码 来 标识 。 尽 管 这些 标 识 办 法 都 可 以 用 来 
识别 一 个 人 ， 但 是 在 特定 环境 下 ， 某 种 识别 方法 可 能 比 另 一 种 方法 更 为 适合 。 例 如 ，IRS 
(美国 那个 声名 狼 籍 的 税务 征收 机 构 ) 的 计算 机 更 喜欢 使 用 定 长 的 社会 保险 号 码 而 不 是 出 生 
证 书 上 的 姓名 。 男 一 方面 ， 普 通 人 乐于 使 用 更 好 记 的 出 生 证 书 上 的 姓名 而 不 是 社会 保险 号 
码 。( 毫 无 疑问 ， 你 能 想象 人 们 之 间 以 这 种 方式 说 话 吗 ”如 “你 好 ， 我 叫 132-67-9875。 请 找 
一 下 我 的 丈夫 178-87-1146”,) 

因特网 上 的 主机 和 人 类 一 样 ， 可 以 使 用 多 种 方式 进行 标识 。 主 机 的 一 种 标识 方法 是 用 
它 的 主机 名 (hostname), ， 如 www. facebook. com, www. google. com, gaia. cs. umass. edu 以 
及 cis. poly. edu 等 ， 这 些 名 字 便 于 记忆 也 乐于 被 人 们 接受 。 然 而 ， 主 机 名 几乎 没有 提供 
(即使 有 也 很 少 ) 关于 主机 在 因特网 中 位 置 的 信息 。 (一 个 名 为 www. eurecom. fr 的 主机 以 
HAH .他 结束 ， 告 诉 我 们 该 主机 很 可 能 在 法 国 ， 仅 此 而 已 。) 况且 ， 因 为 主机 名 可 能 由 不 
定 长 的 字母 数字 组 成 ， 路 由 器 难以 处 理 。 由 于 这 些 原 因 ， 主 机 也 可 以 使 用 所 谓 IP 地 址 
(IP address) 进行 标识 。 

我 们 将 在 第 4 章 更 为 详细 地 讨论 IP 地 址 ， 但 现在 简略 地 介绍 一 下 还 是 有 必要 的 。 一 
个 耳 地 址 由 4 个 字 节 组 成 ， 并 有 着 严格 的 层次 结构 。 例 如 121. 7. 106. 83 这 样 一 个 人 地 
址 ， 其 中 的 每 个 字 节 都 被 句点 分 隅 开 来 ， 表 示 了 0 ~255 的 十 进 制 数字 。 我 们 说 IP 地 址 具 
有 层次 结构 ， 是 因为 当 我 们 从 左 至 右 扫描 它 时 ， 我 们 会 得 到 越 来 越 具 体 的 关于 主机 位 于 因 
特 网 何 处 的 信息 〈 即 在 众多 网 络 的 哪个 网 络 里 ) 。 类 似 地 ， 当 我 们 从 下 向 上 查看 邮政 地 址 
时 ， 我 们 能 够 获得 该 地 址 位 于 何 处 的 越 来 越 具 体 的 信息 。 


2.4.1 DNS 提供 的 服务 


我 们 刚刚 看 到 了 识别 主机 有 两 种 方式 ， 通 过 主机 名 或 者 P Hott, AIS EF iciZ 
的 主机 名 标识 方式 ， 而 路 由 需 则 喜欢 定 长 的 、 有 着 层次 结构 的 卫 地址。 为 了 折 中 这 些 不 
同 的 偏好 ， 我 们 需要 一 种 能 进行 主机 名 到 IP 地 址 转换 的 目录 服务 。 这 就 是 域名 系统 
(Domain Name System, DNS) 的 主要 任务 。DNS 是 : QD 一 个 由 分 层 的 DNS 服务 器 (DNS 
server) 实现 的 分 布 式 数据 库 ; 凶 一 个 使 得 主机 能 够 查询 分 布 式 数据 库 的 应 用 层 协议 。 
DNS 服务 器 通 常 是 运行 BIND ( Berkeley Internet Name Domain) 软件 [BIND 2012] 的 
UNIX 机 器 。DNS 协议 运行 在 UDP ŻE, (EH 53 号 端口 。 
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DNS: 通过 客户 -服务 器 模式 提供 的 重要 网 络 功能 


与 HTTP、FTP 和 SMTP 协议 一 样 ，DNS 协议 是 应 用 层 协 议 ， 其 原因 在 于 : DA 
客户 -服务 器 模式 运行 在 通信 的 端 系统 之 间 ; 加 在 通信 的 端 系统 之 间 通 过 下 面 的 端 到 端 
运输 协议 来 传送 DNS 报 文 。 然 而 ， 在 其 他 意义 上 ，DNS 的 作用 非常 不 同 于 Web 应 用 、 
文件 传输 应 用 以 及 电子 邮件 应 用 。 与 这 些 应 用 程序 不 同 之 处 在 于 ，DNS 不 是 一 个 直接 和 
用 户 打 交道 的 应 有 用。 相反，DNS 是 为 因特网 上 的 用 户 应 用 程序 以 及 其 他 软件 提供 一 种 核 
心 功能 ， 即 将 主机 名 转换 为 其 背后 的 卫 地 址 。 我 们 在 1.2 节 就 提 到 ， 因 特 网 体系 结构 | 
的 复杂 性 大 多 数位 于 网 络 的 “边缘 ”。DNS 通过 采用 了 位 于 网 络 边缘 的 客户 和 服务 器 ， 
实现 了 关键 的 名 字 到 地 址 转换 功能 ， 它 还 是 这 种 设计 原理 的 另 一 个 范例 。 














DNS 通常 是 由 其 他 应 用 层 协议 所 使 用 的 ， 包 括 HTTP, SMTP 和 FTP， 将 用 户 提供 的 主 
机 名 解析 为 IP 地 址 。 举 一 个 例子 ， 考 虑 运行 在 某 用 户主 机 上 的 一 个 浏览 器 〈 即 一 个 HTTP 
客户 ) 请 求 URL www. someschool. edu/index. html 页 面 时 会 发 生 什 么 现象 。 为 了 使 用 户 的 
主机 能 够 将 一 个 HTTP 请 求 报 文 发 送 到 Web 服务 器 www. someschool. edu， 该 用 户主 机 必须 
获得 www. someschool. edu 的 卫 地址。 其 做 法 如 下 。 

1) 同一 台 用 户主 机 上 运行 着 DNS 应 用 的 客户 端 。 

2) 浏览 器 从 上 述 URL 中 抽取 出 主机 名 www. someschool edu， 并 将 这 人 台 主 机 名 传 给 
DNS 应 用 的 客户 端 。 

3) DNS 客户 向 DNS 服务 器 发 送 一 个 包含 主机 名 的 请 求 。 

4) DNS 客户 最 终 会 收 到 一 份 回答 报 文 ， 其 中 含有 对 应 于 该 主机 名 的 IP 地址 。 

5) 一 旦 浏览 器 接收 到 来 自 DNS 的 该 IP 地 址 ， 它 能 够 向 位 于 该 IP 地 址 80 端口 的 
HTTP 服务 器 进程 发 起 一 个 TCP 连接 。 

从 这 个 例子 中 ， 我 们 可 以 看 到 DNS 给 使 用 它 的 因特网 应 用 带 来 了 额外 的 时 延 ， 有 时 
还 相当 可 观 。 幸 运 的 是 ， 如 我 们 下 面 讨 论 的 那样 ， 想 获得 的 IP 地 址 通常 就 缓存 在 一 个 
“附近 的 ”DNS 服务 器 中 ， 这 有 助 于 减少 DNS 的 网 络 流量 和 DNS 的 平均 时 延 。 

除了 进行 主机 名 到 IP 地 址 的 转换 外 ，DNS 还 提供 了 一 些 重要 的 服务 : 

e 主机 别名 (host aliasing) 。 有 着 复杂 主机 名 的 主机 能 拥有 一 个 或 者 多 个 别名 。 例 
如 ， 一 台 名 为 relayl. west-coast. enterprise. com 的 主机 ， 可 能 还 有 两 个 别名 为 enter- 
prise. com 和 www. enterprise. com。 在 这 种 情况 F, relayl. west- coast. enterprise. com 
也 称 为 规范 主机 名 (canonical hostname) 。 主 机 别名 ( 当 存 在 时 ) 比 主机 规范 名 更 
加 容易 记忆 。 应 用 程序 可 以 调用 DNS 来 获得 主机 别名 对 应 的 规范 主机 名 以 及 主机 
AY IP HEHE, 
邮件 服务 器 别名 (mail server aliasing) 。 显 而 易 见 ， 人 们 也 非常 希望 电子 邮件 地 址 
好 记忆 。 例 如 ， 如 果 Bob 在 雅虎 邮件 上 有 一 个 账户 ，Bob 的 邮件 地 址 就 像 bob@ ya- 
hoo. com 这 样 简单 。 然 而 ， 雅 虎 邮 件 服务 器 的 主机 名 可 能 更 为 复杂 ， 不 像 ya- 
hoo. com 那样 简单 好 记 (人 例如， 规范 主机 名 可 能 像 relay1. west- coast. hotmail. com 
那样 ) 。 电 子 邮件 应 用 程序 可 以 调用 DNS， 对 提供 的 主机 名 别名 进行 解析 ， 以 获得 
该 主机 的 规范 主机 名 及 其 IP 地 址 。 事 实 上 ，MX 记录 (参见 后 面 ) 允许 一 个 公司 
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的 邮件 服务 右 和 Web 服务 器 使 用 相同 〈 别 名 化 的 ) 的 主机 名 ; 例如 ， 一 个 公司 的 
Web 服务 器 和 邮件 服务 器 都 能 叫 作 enterprise. com, 
© 负载 分 配 (load distribution), DNS 也 用 于 在 元 余 的 服务 器 (MITRI Web 服务 器 
等 ) 之 间 进 行 负载 分 配 。 繁 忙 的 站 点 (UN enn. com) 被 元 余 分 布 在 多 台 服 务 器 上 ， 
每 台 服 务 器 均 运 行 在 不 同 的 端 系统 上 ， 每 个 都 有 着 不 同 的 IP 地 址 。 由 于 这 些 元 余 
的 Web 服务 器 ， 一 个 P 地 址 集合 因此 与 同一 个 规范 主机 名 相 联 系 。DNS 数据 库 中 
存储 着 这 些 IP 地 址 集合 。 当 客户 对 映射 到 某 地 址 集合 的 名 字 发 出 一 个 DNS 请 求 
时 ， 该 服务 器 用 IP 地 址 的 整个 集合 进行 啊 应 ， 但 在 每 个 回答 中 循环 这 些 地 址 次 
序 。 因 为 客户 通常 总 是 向 IP 地 址 排 在 最 前 面 的 服务 器 发 送 HTTP 请 求 报 文 ， 所 以 
DNS 就 在 所 有 这 些 元 余 的 Web 服务 器 之 间 循 环 分 配 了 负载 。DNS 的 循环 同样 可 以 
用 于 邮件 服务 器 ， 因 此 ， 多 个 邮件 服务 器 可 以 具有 相同 的 别名 。 一 些 内 容 分 发 公 
司 如 Akamai 也 以 更 加 复杂 的 方式 使 用 DNS [ Dilley 2002 ] ， 以 提供 Web 内 容 分 发 
(BMW 2.6.3 47). 
DNS 由 RFC 1034 和 RFC 1035 定义 ， 并 且 在 几 个 附加 的 RFC 中 进行 了 更 新 。DNS 是 
一 个 复杂 的 系统 ， 我 们 在 这 里 只 是 就 其 运行 的 主要 方面 进行 学 习 。 感 兴趣 的 读者 可 以 参考 
这 些 REC 文档 和 Albitz 和 Liu SAJE [ Albitz 1993]; 亦 可 参阅 文章 [ Mockapetris 1998 ] 
和 [ Mockapetris 2005 ] ， 其 中 [ Mockapetris 1998] 是 回顾 性 的 文章 ， 它 提供 了 DNS 组 成 和 
工作 原理 的 精细 的 描述 。 


2.4.2 DNS 工作 机 理 概述 


下 面 给 出 一 个 DNS 工作 过 程 的 总 体 概括 ， 我 们 的 讨论 将 集中 在 主机 名 到 IP 地 址 转换 
服务 方面 。 

假设 运行 在 用 户主 机 上 的 某 些 应 用 程序 (如 Web 浏览 器 或 邮件 阅读 器 ) 需要 将 主 
机 名 转换 为 IP 地 址 。 这 些 应 用 程序 将 调用 DNS 的 客户 端 ， 并 指明 需要 被 转换 的 主机 名 
(在 很 多 基于 UNIX 的 机 器 上 ， 应 用 程序 为 了 执行 这 种 转换 需要 调用 果 数 gethostbyname() ) 。 
用 户主 机 上 的 DNS 接收 到 后 ， 向 网 络 中 发 送 一 个 DNS 查询 报 文 。 所 有 的 DNS 请 求 和 
回答 报 文 使 用 UDP 数据 报 经 端口 53 发 送 。 经 过 若干 毫秒 到 若干 秒 的 时 延 后 ， 用 户主 
机 上 的 DNS 接收 到 一 个 提供 所 希望 映射 的 DNS 回答 报 文 。 这 个 映射 结果 则 被 传递 到 
调用 DNS 的 应 用 程序 。 因 此 ， 从 用 户主 机 上 调用 应 用 程序 的 角度 看 ，DNS 是 一 个 提 
供 简 单 、 直 接 的 转换 服务 的 黑 盒 子 。 但 事实 上 ， 实 现 这 个 服务 的 黑 盒子 非常 复杂 ， 它 
由 分 布 于 全 球 的 大 量 DNS 服务 器 以 及 定义 了 DNS 服务 器 与 查询 主机 通信 方式 的 应 用 
层 协议 组 成 。 

DNS 的 一 种 简单 设计 是 在 因特网 上 只 使 用 一 个 DNS 服务 器 ， 该 服务 器 包含 所 有 的 映 
射 。 在 这 种 集中 式 设计 中 ， 客 户 直 接 将 所 有 查询 直接 发 往 单 一 的 DNS 服务 器 ， 同 时 该 
DNS 服务 器 直接 对 所 有 的 查询 客户 做 出 响应 。 尽 管 这 种 设计 的 简单 性 非常 具有 吸引 力 ， 但 
它 不 适用 于 当今 的 因特网 ， 因 为 因特网 有 着 数量 巨大 (并 持续 增长 ) 的 主机 。 这 种 集中 式 
设计 的 问题 包括 : 

e 单 点 故障 (a single point of failure), WRZ DNS 服务 器 月 演 ， 整 个 因特网 随 之 

EE | 
。 通信 容量 (traffic volume), ŽA DNS 服务 器 不 得 不 处 理 所 有 的 DNS 查询 (用 于 为 
上 亿 台 主机 产生 的 所 有 HTTP 请 求 报 文 和 电子 邮件 报 文 服务 ) 。 
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e 远 距离 的 集中 式 数 据 库 (distant centralized database), 7+ DNS 服务 器 不 可 能 
“邻近 ”所 有 查询 客户 。 如 果 我 们 将 单 台 DNS 服务 器 放 在 纽约 市 ， 那 么 所 有 来 目 
澳大利亚 的 查询 必须 传播 到 地 球 的 男 一 边 ， 中 和 间 也 许 还 要 经 过 低速 和 拥塞 的 链 路 。 
这 将 导致 严重 的 时 延 。 

e 维护 (maintenance)。 单 个 DNS 服务 器 将 不 得 不 为 所 有 的 因特网 主机 保留 记录 。 
这 不 仅 将 使 这 个 中 央 数 据 库 庞大 ， 而 且 它 还 不 得 不 为 解决 每 个 新 添加 的 主机 而 频 
繁 更 新 。 

总 的 来 说 ， 在 单一 DNS 服务 器 上 运行 集中 式 数据 库 完 全 没有 可 扩展 能 力 。 因 此 ，DNS 
采用 了 分 布 式 的 设计 方案 。 事 实 上 ，DNS 是 一 个 在 因特网 上 实现 分 布 式 数据 库 的 精彩 
范例 。 

1. 分 布 式 、 层 次 数据 库 


为 了 处 理 扩展 性 问题 ，DNS 使 用 了 大 量 的 DNS 服务 器 ， 它 们 以 层次 方式 组 织 ， 并 
且 分 布 在 全 世界 范围 内 。 没 有 一 台 DNS 服务 器 拥有 因特网 上 所 有 主机 的 映射 。 相 反 ， 
这 些 映射 分 布 在 所 有 的 DNS 服务 器 上 。 大 致 说 来 ,有 3 种 类 型 的 DNS 服务 器 : 根 DNS 
服务 器 、 顶 级 域 (Top-Level Domain, TLD) DNS 服务 器 和 权威 DNS ARF A. HEM HF 
器 以 图 2-17 中 所 示 的 层次 结构 组 织 起 来 。 为 了 理解 这 3 种 类 型 的 DNS 服务 器 交互 的 方 
式 ， 假 定 一 个 DNS 客户 要 决定 主机 名 www. amazon. com 的 IP 地 址 。 粗 略 说 来 ， 将 发 生 
下 列 事件 。 客 户 首先 与 根 服务 器 之 一 联系 ， 它 将 返回 顶级 域名 com 的 TLD 服务 器 的 IP 
地 址 。 该 客户 则 与 这 些 TLD 服务 器 之 一 联系 ， 它 将 为 amazon. com 返回 权威 服务 器 的 IP 
地 址 。 最 后 ， 该 客户 与 amazon. com 权威 服务 器 之 一 联系 ， 它 为 主机 名 www. amazon. com 
返回 其 IP 地 址 。 我 们 将 很 快 更 为 详细 地 考察 DNS 查找 过 程 。 不 过 我 们 先 仔细 看 一 下 这 
3 种 类 型 的 DNS 服务 器 。 





图 2-17 部 分 DNS 服务 器 的 层次 结构 


。 DNS 服务 器 。 有 400 多 个 根 名 字 服 务 器 遍及 全 世界 。 这 些 根 名 字 服 务 秀 由 13 
个 不 同 的 组 织 管理 。 根 名 字 服 务 器 的 全 部 清单 连同 管理 它们 的 组 织 及 其 IP 地 址 可 
以 在 | Root Servers 2016] 中 找到 。 根 名 字 服 务 器 提供 TLD 服务 器 的 IP 地 址 。 

e 顶级 域 (DNS) 服务 器 。 对 于 每 个 顶级 域 (如 com、org、net、edu 和 gov) 和 所 有 
国家 的 顶级 域 (如 uk、fr、ca Al jp), 都 有 TLD 服务 器 (ARS AES). Verisign 
Global Registry Services 公司 维护 com 顶级 域 的 TLD ARS #5, Educause 公司 维护 edu 
顶级 域 的 TLD 服务 器 。 支 持 TLD 的 网 络 基 础 设施 可 能 是 大 而 复杂 的 ，[ Osterweil 
2012] 对 Verisign 网 络 进行 了 很 好 的 概述 。 所 有 顶级 域 的 列表 参见 [TLD list 
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2016] > TLD 服务 器 提供 了 权威 DNS 服务 器 的 IP 地 址 。 

。 权威 DNS 服务 器 。 在 因特网 上 具有 公共 可 访问 主机 (如 Web 服务 器 和 邮件 服务 
fir) 的 每 个 组 织 机 构 必 须 提供 公共 可 访问 的 DNS 记录 ， 这 些 记录 将 这 些 主机 的 名 
字 映 射 为 IP 地 址 。 一 个 组 织 机 构 的 权威 DNS 服务 器 收藏 了 这 些 DNS 记录 。 一 个 
组 织 机 构 能 够 选择 实现 它 自己 的 权威 DNS 服务 器 以 保存 这 些 记 录 ; 另 一 种 方法 
是 ， 该 组 织 能 够 支付 费用 ， 让 这 些 记录 存储 在 某 个 服务 提供 商 的 一 个 权威 DNS 服 
务 咒 中 。 多 数 大 学 和 大 公司 实现 和 维护 它们 上 自己 基本 和 辅助 (备份 ) 的 权威 DNS 
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根 、TLD 和 权威 DNS 服务 器 都 处 在 该 DNS 服务 器 的 层次 结构 中 ， 如 图 2-17 所 示 。 还 
有 另 一 类 重要 的 DNS 服务 器 ， 称 为 本 地 DNS 服务 器 (local DNS server) 。 严 格 说 来 ， 一 个 
本 地 DNS 服务 器 并 不 属于 该 服务 器 的 层次 结构 ， 但 它 对 DNS 层次 结构 是 至 关 重 要 的 。 每 
个 ISP (如 一 个 居民 区 的 ISP 或 一 个 机 构 的 ISP) 都 有 一 台 本 地 DNS 服务 器 〈 也 叫 默认 名 
字 服 务 器 ) 。 当 主机 与 某 个 ISP 连接 时 ， 该 ISP 提供 一 台 主 机 的 IP 地址， 该 主机 具有 一 台 
或 多 台 其 本 地 DNS 服务 器 的 IP 地 址 (通常 通过 DHCP, 将 在 第 4 章 中 讨论 ) 。 通 过 访问 
Windows 或 UNIX 的 网 络 状 态 窗口 ， 用 户 能 够 容易 地 确定 他 的 本 地 DNS 服务 器 的 IP 地 址 。 


主机 的 本 地 DNS 服务 器 通常 “邻近 ”本 主 
机 。 对 某 机 构 ISP 而 言 ， 本 地 DNS ARF Hh 
可 能 就 与 主机 在 同一 个 局 域 网 中 ; 对 于 某 
居民 区 ISP 来 说 ， 本 地 DNS 服务 器 通常 与 
主机 相隔 不 超过 几 台 路 由 器 。 当 主机 发 出 
DNS 请 求 时 ， 该 请 求 被 发 往 本 地 DNS 服务 
器 ， 它 起 着 代理 的 作用 ， 并 将 该 请 求 转发 
到 DNS 服务 器 层次 结构 中 ， 我 们 下 面 将 更 
为 详细 地 讨论 。 

我 们 来 看 一 个 简单 的 例子 ,假设 主机 
cse. nyu. edu 想 知 道 主 机 gaia. cs. umass. edu 
的 了 PP 地址 。 同 时 假设 纽约 大 学 (NYU) 的 
cse. nyu. edu 主机 的 本 地 DNS AR #8 A 
dns. nyu. edu， 并 且 gaia. cs. umass. edu 的 权 
威 DNS 服务 器 为 dns. umass. edu。 如 图 2-18 
所 示 ， 主 机 cse. nyu. edu 首先 回 它 的 本 地 
DNS 服务 器 dns. nyu. edu 发 送 一 个 DNS # 
询 报 文 。 该 查询 报 文 含有 被 转换 的 主机 名 
gaia. cs. umass. edu。 本 地 DNS 服务 器 将 该 
报 文 转发 到 根 DNS ARS #5. HR DNS 服务 
ane BFL edu 前 级 并 向 本 地 DNS ARF AS 
返回 负责 edu 的 TLD 的 IP 地 址 列表 。 该 本 


根 DNS 服 务 器 





本 地 DNS 服 务 器 


be 


请 求 主机 


cse.nyu.edu 


TLD DNS 服务 器 





权威 DNS 服务 器 


dns.umass.edu 


gaia.cs.umass.edu 


图 2-18 各 种 DNS 服务 器 的 交互 


地 DNS 服务 器 则 再 次 向 这 些 TLD 服务 器 之 一 发 送 查 询 报 文 。 该 TLD 服务 器 注意 到 
umass. edu 前 级 ， 并 用 权威 DNS AR AFA IP 地 址 进行 啊 应 ， 该 权威 DNS 服务 器 是 负责 马 
萨 诸 塞 大 学 的 dns. umass. edu。 最 后 ， 本 地 DNS 服务 器 直接 向 dns. umass. edu 重 发 查询 报 
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X, dns. umass. edu 用 gaia. cs. umass. edu 的 IP 地 址 进行 啊 应 。 注 意 到 在 本 例 中 ， 为 了 获得 
一 台 主 机 名 的 映射 ， 共 发 送 了 8 份 DNS 报 文 : 4 份 查询 报 文 和 4 份 回答 报 文 ! 我 们 将 很 快 
明白 利用 DNS 缓存 减少 这 种 查询 流量 的 方法 。 

我 们 前 面 的 例子 假设 了 TLD 服务 器 知道 用 于 主机 的 权威 DNS 服务 器 的 IP 地址。 一般 
而 言 ， 这 种 假设 并 不 总 是 正确 的 。 相 反 ，TLD 服务 器 只 是 知道 中 间 的 某 个 DNS 服务 器 ， 
该 中 间 DNS 服务 器 依次 才能 知道 用 于 该 主机 的 权威 DNS 服务 器 。 例 如 ， 再 次 假设 马 萨 诸 
塞 大 学 有 一 台 用 于 本 大 学 的 DNS 服务 器 ， 它 称 为 dns. umass. edu。 同 时 假设 该 大 学 的 每 个 
系 都 有 自己 的 DNS 服务 器 ， 每 个 系 的 DNS 服务 器 是 本 系 所 有 主机 的 权威 服务 器 。 在 这 种 
情况 下 ， 当 中 间 DNS 服务 器 dns. umass. edu 收 到 了 对 某 主 机 的 请 求 时 ， 该 主机 名 是 以 
cs. umass. edu 结尾 ， 它 向 dns. nyu. edu 返回 dns. cs. umass. edu 的 IP 地 址 ， 后 者 是 所 有 以 
cs. umass. edu 结尾 的 主机 的 权威 服务 器 。 本 地 DNS 服务 器 dns. nyu. edu lll ja] AQ DNS 服务 
器 发 送 查 询 ， 该 权威 DNS 服务 器 向 本 地 DNS 服务 器 返回 所 希望 的 上 映射， 该 本 地 服务 器 依 
次 回 请 求 主机 返回 该 映射 。 在 这 个 例子 中 ,， 共 发 送 了 10 份 DNS 报 文 ! 

图 2-18 所 示 的 例子 利用 了 递归 查询 (recursive query) 和 和 迭代 查询 (iterative query) 。 
从 cse. nyu. edu 到 dns. nyu. edu 发 出 的 查询 是 递归 查询 ， 因 为 该 查询 以 自己 的 名 义 请 求 
dns. nyu. edu 来 获得 该 映射 。 而 后 继 的 3 个 查询 是 迭代 查询 ， 因 为 所 有 的 回答 都 是 直接 返 
回 给 dns. nyu. edu。 从 理论 上 讲 ， 任 何 DNS 根 DNS 服务 器 
查询 既 可 以 是 迭代 的 也 能 是 递归 的 。 例 如 ， = 
图 2-19 显示 了 一 条 DNS 查询 链 ， 其 中 的 所 di 
有 查询 都 是 递归 的 。 实 践 中 ， 查 询 通 常 尊 








循 图 2-18 中 的 模式 ， 从 请 求 主机 到 本 地 @ OA 
DNS 服务 器 的 查询 是 递归 的 ， 其 余 的 查询 po ` 
是 迭代 的 。 fa 
2. DNS 缓存 E i 
至 此 我 们 的 讨论 一 直 忽略 了 DNS 系统 “本 地 DNS 服务 器 TLD DNS 服务 器 
的 一 个 非常 重要 特色 : DNS 缓存 (DNS dns.nyu.edn 


caching) 。 实 际 上 ， 为 了 改善 时 延性 能 并 减 。 “1 
少 在 因特网 上 到 处 传输 的 DNS 报 文 数量 ， O 
DNS 广泛 使 用 了 缓存 技术 。DNS 缓存 的 原 
理 非常 简单 。 在 一 个 请 求 链 中 ， 当 某 DNS | 
服务 器 接收 一 个 DNS 回答 ( 例如， 包含 蘑 加 


a 





| 


LJ 


权威 DNS 服 务 器 
请 求 主机 dns .umass .edu 


主机 名 到 IP 地 址 的 映射 ) 时 ， 它 能 将 映射 
缓存 在 本 地 存储 器 中 。 例 如 ， 在 图 2- 18 

中 ,每 当 本 地 DNS 服务 器 dns. nyu. edu 从 -se.nyu.edu 
EA DNS 服务 器 接收 到 一 个 回答 ， 它 能 够 

缓存 包含 在 该 回答 中 的 任何 信息 。 如 果 在 

DNS 服务 器 中 缓存 了 一 台 主 机 名 /IP 地 址 gaia.cs.umass.edu 
对 ， 另 一 个 对 相同 主机 名 的 查询 到 达 该 so ie eee 

DNS 服务 器 时 ， 该 DNS 服务 器 就 能 够 提供 

所 要 求 的 IP 地 址 ， 即 使 它 不 是 该 主机 名 的 权威 服务 器 。 由 于 主机 和 主机 名 与 IP 地 址 间 的 
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映射 并 不 是 永久 的 ，DNS 服务 器 在 一 段 时 间 后 (通常 设置 为 两 天 ) 将 丢弃 缓存 的 信息 。 

举 一 个 例子 ， 假 定 主机 apricot. nyu. edu 回 dns. nyu. edu 查询 主机 名 cnn. com 的 IP 地 址 。 
此 后 ， 假 定 过 了 几 个 小 时 ， 纽 约 大 学 的 另外 一 台 主 机 如 kiwi. nyu. edu 也 向 dns. nyu. edu 查询 
相同 的 主机 名 。 因 为 有 了 缓存 ， 该 本 地 DNS 服务 器 可 以 立即 返回 cnn. com 的 IP 地 址 ， 而 不 
必 查 询 任何 其 他 DNS 服务 器 。 本 地 DNS ARS ae Hew A FF TLD 服务 器 的 IP 地址， 因而 允 
许 本 地 DNS 绕 过 查询 链 中 的 根 DNS 服务 器 。 事 实 上 ， 因 为 缓存 ， 除 了 少数 DNS 查询 以 
外 ， 根 服务 器 被 绕 过 了 。 


2.4.3 DNS 记录 和 报 文 


共同 实现 DNS 分 布 式 数据 库 的 所 有 DNS 服务 器 存储 了 资源 记录 (Resource Record, 
RR), RR 提供 了 主机 名 到 IP 地 址 的 映射 。 每 个 DNS 回答 报 文 包含 了 一 条 或 多 条 资源 记 
录 。 在 本 小 节 以 及 后 续 小 节 中 ， 我 们 概要 地 介绍 DNS 资源 记录 和 报 文 ， 更 详细 的 信息 可 
以 在 [ Albitz 1993] 或 有 关 DNS 的 RFC 文档 [RFC 1034; RFC 1035] 中 找到 。 
资源 记录 是 一 个 包含 了 下 列 字段 的 4 元 组 : 


(Name, Value, Type, TTL) 


TTL 是 该 记录 的 生存 时 间 ， 它 决定 了 资源 记录 应 当 从 缓存 中 删除 的 时 间 。 在 下 面 给 出 
的 记录 例子 中 ， 我 们 忽略 掉 TTL 字段 。Name 和 Value 的 值 取决 于 Type: 
© 如 果 Type =A, Sill Name 是 主机 名 ，Value 是 该 主机 名 对 应 的 IP 地 址 。 因 此 ， 一 条 
类 型 为 A 的 资源 记录 提供 了 标准 的 主机 名 到 IP 地 址 的 映射 。 例 如 (relayl. 
bar. foo. com, 145. 37. 93. 126, A) 就 是 一 条 类 型 A 记录 。 
o 如 果 Type =NS， 则 Name 是 个 域 (如 foo. com), Mi Value 是 个 知道 如 何 获得 该 域 
中 主机 IP 地 址 的 权威 DNS 服务 器 的 主机 名 。 这 个 记录 用 于 沿 着 查询 链 来 路 由 DNS 
查询 。 例 如 (foo. com, dns. foo. com, NS) 就 是 一 条 类 型 为 NS 的 记录 。 
e 如 果 Type =CNAME， 则 Value 是 别名 为 Name 的 主机 对 应 的 规范 主机 名 。 该 记录 
能 够 向 查询 的 主机 提供 一 个 主机 名 对 应 的 规范 主机 名 ， 例 如 (foo. com, relayl. 
bar. foo. com, CNAME) 就 是 一 条 CNAME 类 型 的 记录 。 
e 如 果 Type =MX， 则 Value 是 个 别名 为 Name 的 邮件 服务 器 的 规范 主机 名 。 举 例 来 
说 ，(foo. com, mail. bar. foo. com, MX) 就 是 一 条 MX 记录 。MX 记录 人 允许 邮件 服 
务 器 主机 名 具有 简单 的 别名 。 值 得 注意 的 是 ， 通 过 使 用 MX 记录 ， 一 个 公司 的 邮 
件 服务 器 和 其 他 服务 器 ( 如 它 的 Web 服务 器 ) 可 以 使 用 相同 的 别名 。 为 了 获得 邮 
件 服务 器 的 规范 主机 名 ，DNS 客户 应 当 请 求 一 条 MX 记录 ; 而 为 了 获得 其 他 服务 
器 的 规范 主机 名 ，DNS 客户 应 当 请 求 CNAME 记录 。 
如 果 一 台 DNS 服务 器 是 用 于 某 特定 主机 名 的 权威 DNS 服务 器 ， 那 么 该 DNS 服务 器 会 
有 一 条 包含 用 于 该 主机 名 的 类 型 A 记录 (即使 该 DNS 服务 器 不 是 其 权威 DNS 服务 器 ， 它 
也 可 能 在 缓存 中 包含 有 一 条 类 型 A 记录 )。 如 果 服 务 器 不 是 用 于 某 主 机 名 的 权威 服务 器 ， 
那么 该 服务 器 将 包含 一 条 类 型 NS 记录 ， 该 记录 对 应 于 包含 主机 名 的 域 ; 它 还 将 包括 一 条 
类 型 A 记录 ， 该 记录 提供 了 在 NS 记录 的 Value 字段 中 的 DNS 服务 器 的 IP 地 址 。 举 例 来 
说 ， 假 设 一 台 edu TLD 服务 器 不 是 主机 gaia. cs. umass. edu 的 权威 DNS 服务 器 ， 则 该 服务 
器 将 包含 一 条 包括 主机 cs. umass. edu 的 域 记 录 ， 如 (umass. edu, dns. umass. edu, NS); 
该 edu TLD 服务 器 还 将 包含 一 条 类 型 A 记录 ， 如 (dns. umass. edu，128. 119. 40. 111，A) ， 


该 记录 将 名 字 dns. umass. edu 映射 为 一 个 IP 地 址 。 
1. DNS 报 文 


在 本 节 前 面 ， 我们 提 到 了 DNS 查询 和 回答 报 文 。DNS 只 有 这 两 种 报 文 ,， 并且， 查询 
和 回答 报 文 有 着 相同 的 格式 ， 如 图 2-20 所 示 。DNS 报 文中 各 字段 的 语义 如 下 : 





DERU i 
i 问题 数 it | a 回答 RR 数 12 字 节 
ue eer | neva a Bt 
Bagel nh eats EE 
局 上 权威 服务 器 的 记录 





附加 信息 资源 记录 的 变量 数 ) 上 其 使 用 的 附加 .有 帮助 的 "信息 


图 2-20 DNS 报 文 格式 


前 12 个 字 节 是 首部 区 域 ， 其 中 有 几 个 字段 。 第 一 个 字段 (RRF) 是 一 个 16 比 
特 的 数 ， 用 于 标识 该 查询 。 这 个 标识 符 会 被 复制 到 对 查询 的 回答 报 文中 ， 以 便 让 
客户 用 它 来 匹配 发 送 的 请 求 和 接收 到 的 回答 。 标 志 字 段 中 含有 在 干 标志 。!1 比特 
的 “查询 /回答 ”标志 位 指出 报 文 是 查询 报 文 (0) 还 是 回答 报 文 (1) 。 当 茶 DNS 
服务 器 是 所 请 求 名 字 的 权威 DNS 服务 器 时 ，1 比特 的 “权威 的 ”标志 位 被 置 在 回 
答 报 文中 。 如 果 客 户 (主机 或 者 DNS 服务 器 ) 在 该 DNS 服务 絮 没 有 某 记录 时 希望 
它 执 行 递归 查询 ， 将 设置 1 比特 的 “希望 递归 ”标志 位 。 如 果 该 DNS HR Ar FF 
递归 查询 ， 在 它 的 回答 报 文中 会 对 1 比特 的 “递归 可 用 ”标志 位 置 位 。 在 该 首部 
中 ,还 有 4 个 有 关 数 量 的 字段 ， 这 些 字 有 段 指出 了 在 首部 后 的 4 类 数据 区 域 出 现 的 
数量 。 

问题 区 域 包含 着 正在 进行 的 查询 信息 。 该 区 域 包括 : OFFER, AIEEE RA 
的 主机 名 字 ; @) 类 型 字段 ， 指 出 有 关 该 名 字 的 正 被 询问 的 问题 类 型 ， 例 如 主机 地 址 
是 与 一 个 名 字 相 关联 〈 类 型 A) 还 是 与 某 个 名 字 的 邮件 服务 器 相关 联 〈 类 型 MX ) 。 
ERKA DNS 服务 器 的 回答 中 ， 回 答 区 域 包 含 了 对 最 初 请 求 的 名 字 的 资源 记录 。 前 
面 讲 过 每 个 资源 记录 中 有 Type (W A, NS, CNAME 和 MX) 字段 、Value 字段 和 
TTL 字段 。 在 回答 报 文 的 回答 区 域 中 可 以 包含 多 条 RR， 因 此 一 个 主机 名 能 够 有 多 
个 全 地址 (例如 ， 就 像 本 节 前 面 讨论 的 见 余 Web IRIA) 。 

权威 区 域 包含 了 其 他 权威 服务 需 的 记录 。 

附加 区 域 包含 了 其 他 有 帮助 的 记录 。 例 如 ， 对 于 一 个 MX 请 求 的 回答 报 文 的 回答 
区 域 包含 了 一 条 资源 记录 ， 该 记录 提供 了 邮件 服务 器 的 规范 主机 名 。 该 附加 区 域 
包含 一 个 类 型 A 记录 ， 该 记录 提供 了 用 于 该 邮件 服务 需 的 规范 主机 名 的 卫 地 址 。 


你 愿意 从 正在 工作 的 主机 直接 向 某 些 DNS 服务 器 发 送 一 个 DNS 查询 报 文 吗 ? 使 用 
nslookup 程序 (nslookup program) 能 够 容易 地 做 到 这 一 点 ， 这 对 于 多 数 Windows Fil UNIX 平 
台 ，nslookup 程序 是 可 用 的 。 例 如 ， 从 一 台 Windows 主机 打开 命令 提示 符 界面 ， 直接 键入 
“nslookup” 即 可 调用 该 nslookup 程序 。 在 调用 nslookup 后 ， 你 能 够 问 任 何 DNS ARF at 


( 根 、TLD 或 权威 ) 发 送 DNS 查询 。 在 接收 到 来 自 DNS 服务 器 的 回答 后 ，nslookup 将 显示 
包括 在 该 回答 中 的 记录 (以 人 可 读 的 格式 ) 。 从 你 自己 的 主机 运行 nslookup 还 有 一 种 方法 ， 
即 访问 允许 你 远程 应 用 nslookup 的 许多 Web 站 点 之 一 (在 一 个 搜索 引擎 中 键 人 
“nslookup” 就 能 够 得 到 这 些 站 点 中 的 一 个 ) 。 本 章 最 后 的 DNS Wireshark 实验 将 使 你 更 为 
详细 地 研究 DNS, 

2. 在 DNS 数据 库 中 插入 记录 

上 面 的 讨论 只 是 关注 如 何 从 DNS 数据 库 中 取 数 据 。 你 可 能 想 知道 这 些 数 据 最 初 是 怎 
么 进入 数据 库 中 的 。 我 们 在 一 个 特定 的 例子 中 看 看 这 是 如 何 完 成 的 。 假 定 你 刚刚 创建 一 个 
称 为 网 络 乌托邦 (Network Utopia) 的 令 人 兴奋 的 新 创业 公司 。 你 必定 要 做 的 第 一 件 事 是 
在 注册 登记 机 构 注 册 域 名 networkutopia. com。 注 册 登 记 机 构 (registrar) 是 一 个 商业 实体 ， 
它 验证 该 域名 的 唯一 性 ， 将 该 域名 输入 DNS 数据 库 (如 下 面 所 讨论 的 那样 )， 对 提供 的 服 
务 收取 少量 费用 。1999 年 前 ， 唯 一 的 注册 登记 机 构 是 Nework Solution， 它 独家 经 营 对 于 
com, net 和 org 域名 的 注册 。 但 是 现在 有 许多 注册 登记 机 构 竞 争 客 户 ， 因 特 网 名 字 和 地 址 
分 配 机 构 (Internet Corporation for Assigned Names and Numbers, ICANN) 回 各 种 注册 登记 
机 构 授权 。 在 http://www. internic. net 上 可 以 找到 授权 的 注册 登记 机 构 的 列表 。 

当 你 向 某 些 注册 登记 机 构 注 册 域 名 networkutopia. com 时 ， 需 要 向 该 机 构 提 供 你 的 基本 
和 辅助 权威 DNS 服务 需 的 名 字 和 了 瑟 地址。 假定 该 名 字 和 IP 地 址 是 dnsl. networkutopia. com 
和 dns2. networkutopia. com 及 212. 212. 212. 1 和 212. 212. 212.2 。 对 这 两 个 权威 DNS AR 4 
的 每 一 个 ， 该 注册 登记 机 构 确 保 将 一 个 类 型 NS 和 一 个 类 型 A 的 记录 输入 TLD com 服务 
Ako FIEX FHF networkutopia. com 的 基本 权威 服务 器 ， 该 注册 登记 机 构 将 下 列 两 条 资 
源 记录 插入 该 DNS 系统 中 : 


(networkutopia.com, dnsl.networkutopia.com, NS) 
(dnsl.networkutopia.com, 212.212.212.1, A) 


你 还 必须 确保 用 于 Web 服务 人 www. networkutopia. com 的 类 型 A 资源 记录 和 用 于 邮件 
服务 器 mail. networkutopia. com 的 类 型 MX 资源 记录 被 输入 你 的 权威 DNS 服务 器 中 。( 直到 
最 近 ， 每 台 DNS 服务 需 中 的 内 容 都 是 静态 配置 的 ， 例 如 来 自 系 统管 理 员 创建 的 配置 文件 。 
最 近 ， 在 DNS 协议 中 添加 了 一 个 更 新 (UPDATE) 选项 ， 人 允许 通过 DNS 报 文 对 数据 库 中 
的 内 容 进行 动态 添加 或 者 删除 。[ RFC 2136] 和 [RFC 3007] 定义 了 DNS 动态 更 新 。) 

一 旦 完成 所 有 这 些 步 又 ， 人 们 将 能 够 访问 你 的 Web 站 点 ， 并 向 你 公司 的 雇员 发 送 电 
子 邮 件 。 我 们 通过 验证 该 说 法 的 正确 性 来 总 结 DNS 的 讨论 。 这 种 验证 也 有 助 于 充实 我 们 
已 经 学 到 的 DNS 知识 。 假 定 在 澳大利亚 的 Alice 要 观看 www. networkutopia. com 的 Web 页 
面 。 如 前 面 所 讨论 ， 她 的 主机 将 首先 回 其 本 地 DNS 服务 器 发 送 请 求 。 该 本 地 服务 器 接着 
则 联系 一 个 TLD com 服务 器。( 如 果 TLD com 服务 器 的 地 址 没有 被 缓存 ， 该 本 地 DNS 服务 
器 也 将 必须 与 根 DNS 服务 器 相 联 系 。) 该 TLD 服务 器 包含 前 面 列 出 的 类 型 NS 和 类 型 A 资 
源 记录 ， 因 为 注册 登记 机 构 将 这 些 资源 记录 插入 所 有 的 TLD com 服务 器 。 该 TLD com 服务 
alt] Alice 的 本 地 DNS 服务 右 发 送 一 个 回答 ， 该 回答 包含 了 这 两 条 资源 记录 。 该 本 地 DNS 
Ae #8 Wl fa] 212. 212. 212. 1 发 送 一 个 DNS 查询 ， 请 求 对 应 于 www. networkutopia. com 的 类 
型 A 记录 。 该 记录 提供 了 所 希望 的 Web 服务 器 的 IP 地 址 ， 如 212.212.71.4， 本 地 DNS Ak 
务 需 将 该 地 址 回 传 给 Alice 的 主机 。Alice 的 浏览 器 此 时 能 够 向 主机 212. 212. 71. 4 发 起 一 个 
TCP 连接 ， 并 在 该 连接 上 发 送 一 个 HTTP 请 求 。 当 一 个 人 在 网 上 冲浪 时 ， 有 比 满足 眼球 更 
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多 的 事情 在 进行 ! 





DNS 脆弱 性 


我 们 已 经 看 到 DNS 是 因特网 基础 设施 的 一 个 至 关 重 要 的 组 件 ， 对 于 包括 Web、 电 
子 邮 件 等 的 许多 重要 的 服务 ， 没 有 它 都 不 能 正常 工作 。 因 此 ， 我 们 自然 要 间 ，DNS 怎么 | 
能 够 被 攻击 呢 ? DNS 是 一 个 易 受 攻击 的 目标 吗 ? 它 是 将 会 被 淘汰 的 服务 吗 ? 大 多 数 因 特 | 
网 应 用 会 随同 它 一 起 无 法 工作 吗 ? 

想到 的 第 一 一 种 针对 DNS 服务 的 攻击 是 分 布 式 拒绝 服务 (DDoS) PERELE (A 
见 1.6 节 )。 例 如 ， 某 攻击 者 能 够 试图 向 每 个 DNS 根 服务 器 发 送 大 量 的 分 组 ， 使 得 大 多 
数 合法 DNS 请 求 得 不 到 回答 。 这 种 对 DNS 根 服 务 器 的 DDoS 大 规模 攻击 实际 发 生 在 
2002 年 10 月 21 日 。 在 这 次 攻击 中 ， 该 攻击 者 利用 一 个 僵尸 网 络 向 13 个 DNS 根 服务 器 
中 的 每 个 都 发 送 了 大 批 的 ICMP ping 报 文 负载 。 (5.6 节 中 讨论 了 ICMP 报 文 。 此 时 ， 知 | 
道 ICMP 分 组 是 特殊 类 型 的 IP 数据 报 就 可 以 了 。) 幸运 的 是 ， 这 种 大 规模 攻击 所 带 来 的 | 
损害 很 小 ， 对 用 户 的 因特网 体验 几乎 没有 或 根本 没有 影响 。 攻 击 者 的 确 成 功 地 将 大 量 的 -| 
分 组 指向 了 根 服 务 器 ， 但 许多 DNS 根 服 务 器 受到 了 分 组 过 滤器 的 保护 ， 配置 的 分 组 过 | | 
滤器 阻挡 了 所 有 指向 根 服 务 器 的 ICMP ping 报 文 。 这 些 被 保护 的 服务 器 因此 未 受伤 害 并 ， 
且 与 平常 一 样 发 挥 着 作用 。 此 外 ， 大 多 数 本 地 DNS 服务 器 缕 存 了 顶级 域名 服务 器 的 IP | 
地 址 ， 使 得 这 些 请 求 过 程 通常 绕 过 了 DNS 根 服务 器 。 | 

对 DNS 的 潜在 更 为 有 效 的 DDoS 攻击 将 是 向 顶级 域名 服务 器 (例如 向 所 有 处 理 . com | 
域 的 顶级 域名 服务 器 ) 发 送 大 量 的 DNS 请 求 。 过 滤 指 向 DNS 服务 器 的 DNS 请 求 将 更 为 | 
困难 ， 并 且 顶 级 域名 服务 器 不 像 根 服务 器 那样 容易 绕 过 。 但 是 这 种 攻击 的 严重 性 通过 本 
地 DNS 服务 器 中 的 缓存 技术 可 将 部 分 地 被 缓解 。 

DNS 能 够 潜在 地 以 其 他 方式 被 攻击 。 在 中 间 人 攻击 中 ， 攻 击 者 截获 来 自主 机 的 请 求 
并 返回 伪造 的 回答 。 在 DNS 毒害 攻击 中 ， 攻 击 者 向 一 台 DNS 服务 器 发 送 伪造 的 回答 ， 
诱 使 服务 器 在 它 的 缓存 中 接收 伪造 的 记录 。 这 些 攻 击 中 的 任 一 种 ， 都 能 够 将 毫 无 疑 虐 的 
Web 用 户 重 定向 到 攻击 者 的 Web 站 点 。 然 而 ， 这 些 攻击 难以 实现 ， 因 为 它们 要 求 截获 
分 组 或 扼 制 住 服务 器 [ Skoudis 2006 | 。 | 

总 而 言 之 ，DNS 自身 已 经 显示 了 对 抗 攻 击 的 令 人 惊讶 的 健壮 性 。 至 今 为 止 ， 还 没有 | 
一 个 攻击 已 经 成 功 地 妨碍 了 DNS IRF. 





2.5 P2P 文件 分 发 


在 目前 为 止 本 章 中 描述 的 应 用 (包括 Web 、 电 子 邮 件 和 DNS) 都 采用 了 客户 -服务 器 
体系 结构 ， 极 大 地 依赖 于 总 是 打开 的 基础 设施 服务 器 。2. 1. 1 节 讲 过 ， 使 用 P2P 体系 结 
构 ， 对 总 是 打开 的 基础 设施 服务 器 有 最 小 的 〈 或 者 没有 ) 依赖 。 与 之 相反 ， 成 对 间歇 连接 
的 主机 〈 称 为 对 等 方 ) 彼此 直接 通信 。 这 些 对 等 方 并 不 为 服务 提供 商 所 拥有 ， 而 是 受用 户 
控制 的 果 面 计算 机 和 膝 上 计算 机 。 

在 本 节 中 我 们 将 研究 一 个 非常 自然 的 P2P 应 用 ， 即 从 单一 服务 硕 回 大 量 主机 ( 称 为 对 


等 方 ) 分 发 一 个 大 文件 。 该 文件 也 许 是 一 个 新 版 的 Linux 操作 系统 ， 对 于 现 有 操作 系统 或 
应 用 程序 的 一 个 软件 补丁 ， 一 个 MP3 音乐 文件 ， 或 一 个 MPEG 视频 文件 。 在 客户 - 服务 
髓 文件 分 发 中 ， 该 服务 器 必须 回 每 个 对 等 方 发 送 该 文件 的 一 个 副本 ， 即 服务 器 承受 了 极 大 
的 负担 ， 并 且 消 耗 了 大 量 的 服务 器 带宽 。 在 P2P 文件 分 发 中 ， 每 个 对 等 方 能 够 向 任何 其 他 
对 等 方 重 新 分 发 它 已 经 收 到 的 该 文件 的 任何 部 分 ， 从 而 在 分 发 过 程 中 协助 该 服务 器 。 到 
2016 年 止 ， 最 为 流行 的 P2P 文件 分 发 协议 是 BitTorrent。 该 应 用 程序 最 初 由 Bram Cohen 所 
人 研发， 现在 有 许多 不 同 的 独立 且 符 合 BitTorrent 协议 的 BitTorrent 客户 ， 就 像 有 许多 符合 
HTTP 协议 的 Web 浏览 器 客户 一 样 。 在 下 面 的 小 节 中 ， 我 们 首先 考察 在 文件 分 发 环境 中 的 
P2P ERRAN AD RE, 然后 我 们 更 为 详细 地 描述 BitTorrent ， 突 出 它 的 最 为 重要 的 特性 

. P2P 体系 结构 的 扩展 性 

pian -服务 器 体系 结构 与 P2P 体系 结构 进行 比较 ， 阐 述 P2P 的 内 在 自 扩展 性 ， 
我 们 现在 考虑 一 个 用 于 两 种 体系 结构 类 型 的 简单 定量 模型 ， 将 一 个 文件 分 发 给 一 个 固定 对 
等 方 集合 。 如 图 2-21 所 示 ， 服 务 器 和 对 等 方 使 用 接 入 链 路 与 因特网 相连 。 其 中 u, 表示 服 
务 右 接 入 链 路 的 上 载 速率 ，u, 表示 第 i 对 等 方 接 入 链 路 的 上 载 速 率 ，d; 表示 了 第 i 对 等 方 
接 入 链 路 的 下 载 速率 。 还 用 FF 表示 被 分 发 的 文件 长 度 (以 比特 计 ) ，N 表示 要 获得 的 该 文 
件 副本 的 对 等 方 的 数量 。 分 发 时 间 (distribution time) 是 所 有 NN 个 对 等 方 得 到 该 文件 的 副 
本 所 需要 的 时 间 。 在 下 面 分 析 分 发 时 间 的 过 程 中 ， 我 们 对 客户 - 服务 器 和 P2P 体系 结构 做 
了 简化 〈 并 且 通 常 是 准确 的 [Akella 2003]) 的 假设 ， 即 因特网 核心 具有 足够 的 带宽 ， 这 
意味 着 所 有 瓶颈 都 在 网 络 接 人 链 路 。 我 们 还 假设 服务 器 和 客户 没有 参与 任何 其 他 网 络 应 
用 ， 因 此 它们 的 所 有 上 传 和 下 载 访问 带宽 能 被 全 部 用 于 分 发 该 文件 。 
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图 2-21 文件 分 发 问题 的 示例 图 


我 们 首先 来 确定 对 于 客户 - 服务 器 体系 结构 的 分 发 时 间 ， 我 们 将 其 表示 为 Dao ER 
P -服务 器 体系 结构 中 ， 没 有 对 等 方 参与 来 帮助 分 发 文件 。 我 们 做 下 列 观察 : 
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© ARF aA NAR EAEE TK SCA — PAS. A AR EAE 
NF 比特 。 因 为 该 服务 器 的 上 载 速率 是 u, 分 发 该 文件 的 时 间 必 定 是 至 少 为 
NF/u,o 
o 令 di 表示 具有 最 小 下 载 速率 的 对 等 方 的 下 载 速 率 ,， 即 dun = min|d,，d,，… 
dy| 。 具 有 最 小 下 载 速率 的 对 等 方 不 可 能 在 少 于 F/dii, 秒 时 间 内 获得 该 文件 的 所 有 
FF 比特。 因此 最 小 分 发 时 间 至 少 为 F/d nino 
将 这 两 个 观察 放 在 一 起 ， 我 们 得 到 
D = max ,一 | 
a ae 
该 式 提供 了 对 于 客户 - 服务 器 体系 结构 的 最 小 分 发 时 间 的 下 界 。 在 课 后 习题 中 将 请 你 
给 出 服务 器 能 够 调度 它 的 传输 以 便 实 际 取得 该 下 界 的 方法 。 因 此 我 们 取 上 面 提供 的 这 个 下 
界 作 为 实际 发 送 时 间 ， 即 


(2-1) 


RIAA (2-1) 看 到 ， 对 足够 大 的 W， 客 户 -服务 器 分 发 时 间 由 NF/u. 确定 。 所 以 ， 
该 分 发 时 间 随 着 对 等 方 N 的 数量 线性 地 增加 。 因 此 举例 来 说 ， 如 果 从 某 星 期 到 下 星期 对 等 
方 的 数量 从 1000 增加 了 1000 倍 ， 到 了 100 万 ,将 该 文件 分 发 到 所 有 对 等 方 所 需要 的 时 间 
就 要 增加 1000 倍 。 
我 们 现在 来 对 P2P 体系 结构 进行 简单 的 分 析 ， 其 中 每 个 对 等 方 能 够 帮助 服务 器 分 发 该 
文件 。 特 别 是 ， 当 一 个 对 等 方 接收 到 某 些 文件 数据 ， 它 能 够 使 用 自己 的 上 载 能 力 重 新 将 数 
据 分 发 给 其 他 对 等 方 。 计 算 P2P 体系 结构 的 分 发 时 间 在 某 种 程度 上 比 计算 客户 - 服务 器 体 
系 结构 的 更 为 复杂 ， 因 为 分 发 时 间 取 决 于 每 个 对 等 方 如 何 向 其 他 对 等 方 分 发 该 文件 的 各 个 
部 分 。 无 论 如 何 ， 能 够 得 到 对 该 最 小 分 发 时 间 的 一 个 简单 表示 式 [Kumar 2006 ] 。 至 此 ， 
我 们 先 做 下 列 观察 : 
。 在 分 发 的 开始 ， 只 有 服务 器 具有 文件 。 为 了 使 社区 的 这 些 对 等 方 得 到 该 文件 ， 该 
服务 器 必须 经 其 接 人 链 路 至 少 发 送 该 文件 的 每 个 比特 一 次 。 因 此 ， 最 小 分 发 时 间 
至 少 是 Fh/u,。( 与 客户 - 服务 器 方案 不 同 ， 由 服务 器 发 送 过 一 次 的 比特 可 能 不 必 
由 该 服务 器 再 次 发 送 ， 因 为 对 等 方 在 它们 之 间 可 以 重新 分 发 这 些 比特 。) 
© 与 客户 -服务 器 体系 结构 相同 ， 具 有 最 低下 载 速 率 的 对 等 方 不 能 够 以 小 于 F/d nin 
秒 的 分 发 时 间 获 得 所 有 F 比特。 因此 最 小 分 发 时 间 至 少 为 F/d nino 

。 最 后 ， 观 察 到 系统 整体 的 总 上 载 能 力 等 于 服务 器 的 上 载 速率 加 上 每 个 单独 的 对 等 
方 的 上 载 速 率 ， 即 wu = +u +e tuyo 系统 必须 向 这 个 对 等 方 的 每 个 交付 
(ER) 下 比特 ， 因 此 总 共 交 付 NF 比特 。 这 不 能 以 快 于 wu 的 速率 完成 。 因 此 ， 
最 小 的 分 发 时 间 也 至 少 是 NF/(u, +u, + +uy)o 

将 这 三 个 观察 放 在 一 起 ， 我 们 获得 了 对 PP 的 最 小 分 发 时 间 ， 表 示 为 Doro 

Doin = na 人 | (9.95 
eae TE Yu, 

A (2-2) 提供 了 对 于 PP 体系 结构 的 最 小 分 发 时 间 的 下 界 。 这 说 明 ， 如 果 我 们 认为 
一 旦 每 个 对 等 方 接收 到 一 个 比特 就 能 够 重 分 发 一 个 比特 的 话 ， 则 存在 一 个 重新 分 发 方案 能 
实际 取得 这 种 下 界 [Kumar 2006 ] 。( 我 们 将 在 课 后 习题 中 证 明 该 结果 的 一 种 特 情形 。) 实 


际 上 ， 被 分 发 的 是 文件 块 而 不 是 一 个 个 比特 。 式 (2-2) 能 够 作为 实际 最 小 分 发 时 间 的 很 
好 近似 。 因 此 ,我们 取 由 式 (2-2) 提供 的 下 界 作为 实际 的 最 小 分 发 时 间 ， 即 





D max E NF 
pp = fu, aome | (2-3) 
l u, + ba U; 


图 2-22 比较 了 客户 -服务 器 和 P2P 体系 结构 的 最 小 分 发 时 间 ， 其 中 假定 所 有 的 对 等 
方 具有 相同 的 上 和 载 速 率 u, ÆR 2-2 中 ， 我 们 已 经 设置 了 F/u=1 小 时 , u,=10u, dnin > 
u.。 因 此 ， 在 一 个 小 时 中 一 个 对 等 方 能 够 传输 整个 文件 ， 该 服务 器 的 传输 速率 是 对 等 方 上 
载 速率 的 10 倍 ， 并 且 (为 了 简化 起 见 ) 3.5 
对 等 方 的 下 载 速率 被 设置 得 足够 大 ， 使 
之 不 会 产生 影响 。 我 们 从 图 2-22 中 看 到 ， | 客户 -服务 器 


对 于 客户 - 服务 器 体系 结构 ， 随 着 对 等 z ge 

方 数 量 的 增加 ， 分 发 时 间 呈 线性 增长 并 RT fo ee 
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器 体系 结构 的 分 发 时 间 ， 并 且 对 于 任意 05 二- 之 和 

的 对 等 方 数量 N， 总 是 小 于 1 小 时 。 因 10 15 20 25 30 35 


此 ， 具 有 P2P 体系 结构 的 应 用 程序 能 够 N 
HADEN. CAP REN ARMA: 
对 等 方 除 了 是 比特 的 消费 者 外 还 是 它们 
的 重新 分 发 者 。 
2. BitTorrent 


BitTorrent 是 一 种 用 于 文件 分 发 的 流行 PPP .协议 [Chao 2011]. FA BitTorrent 的 术语 来 
讲 ， 参 与 一 个 特定 文件 分 发 的 所 有 对 等 方 的 集合 被 称 为 一 个 洪流 (torrent)。 在 一 个 洪流 
中 的 对 等 方 彼此 下 载 等 长 度 的 文件 块 (chunk) ， 典 型 的 块 长 度 为 236KB。 当 一 个 对 等 方 首 
次 加 入 一 个 洪流 时 ， 它 没有 块 。 随 着 时 间 的 流逝 ， 它 累积 了 越 来 越 多 的 块 。 当 它 下 载 块 
时 ， 也 为 其 他 对 等 方 上 载 了 多 个 块 。 一 旦 某 对 等 方 获得 了 整个 文件 ， 它 也 许 (自私 地 ) 高 
开 洪 流 ， 或 〈 大 公 无 私 地 ) 留 在 该 洪流 中 并 继续 向 其 他 对 等 方 上 载 块 。 同 时 ， 任何 对 等 方 
可 能 在 任何 时 候 仅 具 有 块 的 子 集 就 离开 该 洪流 ， 并 在 以 后 重新 加 入 该 洪流 中 。 

我 们 现在 更 为 仔细 地 观察 BitTorrent 运行 的 过 程 。 因 为 BitTorrent 是 一 个 相当 复杂 的 协 
议 ， 所 以 我 们 将 仅 描述 它 最 重要 的 机 制 ， 而 对 某 些 细节 视而不见 ; 这 将 使 得 我 们 能 够 通过 
树木 看 森林 。 每 个 洪流 具有 一 个 基础 设施 节点 ， 称 为 追踪 器 (tracker) 。 当 一 个 对 等 方 加 
入 某 洪流 时 ， 它 向 追踪 器 注册 自己 ， 并 周期 性 地 通知 追踪 器 它 仍 在 该 洪流 中 。 以 这 种 方 
式 ， 追 踪 器 跟踪 参与 在 洪流 中 的 对 等 方 。 一 个 给 定 的 洪流 可 能 在 任何 时 刻 具 有 数 以 百 计 或 
数 以 千 计 的 对 等 方 。 

如 图 2-23 所 示 ， 当 一 个 新 的 对 等 方 Alice 加 入 该 洪流 时 ， 追踪 右 随 机 地 从 参与 对 等 方 
的 集合 中 选择 对 等 方 的 一 个 子 集 (为 了 具体 起 见 ， 设 有 50 个 对 等 方 ) ， 并 将 这 50 个 对 等 
方 的 人 地 址 发 送 给 Alice, Alice 持 有 对 等 方 的 这 张 列 表 ， 试 图 与 该 列表 上 的 所 有 对 等 方 创 
建 并 行 的 TCP 连接 。 我 们 称 所 有 这 样 与 Alice 成 功 地 创建 一 个 TCP 连接 的 对 等 方 为 “邻近 
对 等 方 ”( 在 图 2-23 中 ，Alice 显示 了 仅 有 三 个 邻近 对 等 方 。 通 常 ， 她 应 当 有 更 多 的 对 等 
方 ) 。 随 着 时 间 的 流逝 ， 这 些 对 等 方 中 的 某 些 可 能 离开 ， 其 他 对 等 方 〈 最 初 50 个 以 外 的 ) 


图 2-22 P2P 和 客户 - 服务 器 体系 结构 的 分 发 时 间 
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可 能 试图 与 Alice 创建 TCP 连接 。 因 此 一 个 对 等 方 的 邻近 对 等 方 将 随时 间 而 波动 。 





图 2-23 用 BitTorrent 分 发 文件 


在 任何 给 定 的 时 间 ， 每 个 对 等 方 将 具有 来 自 该 文件 的 块 的 子 集 ， 并 且 不 同 的 对 等 方 具 
有 不 同 的 子 集 。Alice 周期 性 地 (经 TCP 连接 ) 询问 每 个 邻近 对 等 方 它们 所 具有 的 块 列表 。 
如 果 Alice 具有 工 个 不 同 的 邻居 ， 她 将 获得 上 个 块 列表 。 有 了 这 个 信息 ，Alice 将 对 她 当前 
还 没有 的 块 发 出 请 求 〈 仍 通过 TCP 连接 ) 。 

因此 在 任何 给 定 的 时 刻 ，Alice 将 具有 块 的 子 集 并 知道 它 的 邻居 具有 哪些 块 。 利 用 这 
些 信息 ，Alice 将 做 出 两 个 重要 决定 。 第 一 ， 她 应 当 从 她 的 邻居 请 求 哪些 块 呢 ? 第 二 ， 她 
应 当 向 哪些 向 她 请 求 块 的 邻居 发 送 块 ? 在 决定 请 求 哪 些 块 的 过 程 中 ，Alice 使 用 一 种 称 为 
最 稀缺 优先 (rarest first) 的 技术 。 这 种 技术 的 思路 是 ， 针 对 她 没有 的 块 在 她 的 邻居 中 决定 
最 稀缺 的 块 〈 最 稀缺 的 块 就 是 那些 在 她 的 邻居 中 副本 数量 最 少 的 块 ) ， 并 首先 请 求 那 些 最 
稀缺 的 块 。 这 样 ， 最 稀缺 块 得 到 更 为 迅速 的 重新 分 发 ， 其 目标 是 〈 大 致 地 ) 均衡 每 个 块 在 
洪流 中 的 副本 数量 。 

为 了 决定 她 响应 哪个 请 求 ，BitTorrent 使 用 了 一 种 机 灵 的 对 换算 法 。 其 基本 想法 是 ， 
Alice 根据 当前 能 够 以 最 高 速率 向 她 提供 数据 的 邻居 ， 给 出 其 优先 权 。 特 别 是 ，Alice 对 于 
她 的 每 个 邻居 都 持续 地 测量 接收 到 比特 的 速率 ， 并 确定 以 最 高 速率 流入 的 4 个 邻居 。 每 过 
10 秒 ， 她 重新 计算 该 速率 并 可 能 修改 这 4 个 对 等 方 的 集合 。 用 BitTorrent 术语 来 说 ， 这 4 
个 对 等 方 被 称 为 疏通 (unchoked) 。 重 要 的 是 ， 每 过 30 秒 ， 她 也 要 随机 地 选择 另外 一 个 邻 
居 并 向 其 发 送 块 。 我 们 将 这 个 被 随机 选择 的 对 等 方 称 为 Bob。 因 为 Alice 正在 向 Bob 发 送 
数据 ， 她 可 能 成 为 Bob 前 4 位 上 载 者 之 一 ， 这 样 的 话 Bob 将 开始 向 Alice 发 送 数 据 。 如 果 
Bob [a] Alice 发 送 数 据 的 速率 足够 高 ，Bob 接 下 来 也 能 成 为 Alice 的 前 4 MERA. RAZ, 
每 过 30 秒 Alice 将 随机 地 选择 一 名 新 的 对 换 伴侣 并 开始 与 那 位 伴侣 进行 对 换 。 如 果 这 两 名 
对 等 方 都 满足 此 对 换 ， 它 们 将 对 方 放 人 其 前 4 位 列表 中 并 继续 与 对 方 进行 对 换 ， 直 到 该 对 
等 方 之 一 发 现 了 一 个 更 好 的 伴侣 为 止 。 这 种 效果 是 对 等 方 能 够 以 趋 问 于 找到 彼此 的 协调 的 


速率 上 载 。 随 机 选择 邻居 也 人 允许 新 的 对 等 方 得 到 块 ， 因 此 它们 能 够 具有 对 换 的 东西 。 除 了 
这 5 个 对 等 方 (“ 前 ”4 个 对 等 方 和 一 个 试探 的 对 等 方 ) 的 所 有 其 他 相 邻 对 等 方 均 被 “ 阻 
塞 ” ， 即 它们 不 能 从 Alice 接收 到 任何 块 。BitTorrent 有 一 些 有 趣 的 机 制 没 有 在 这 里 讨论 ， 
包括 片 〈 小 块 ) 、 流 水 线 、 随 机 优先 选择 、 残 局 模型 和 反 仿 慢 [ Cohen 2003 | 。 

刚刚 描述 的 关于 交换 的 激励 机 制 常 被 称 为 “一 报 还 一 报 ” (tit-for-tat) [ Cohen 2003 ] 。 
已 证 实 这 种 激励 方案 能 被 回避 [ Liogkas 2006; Locher 2006; Piatek 2007 ] 。 无 论 如 何 ， 
BitTorrent “EARS” 取得 了 广泛 成 功 ， 数 以 百 万 计 的 并 发 对 等 方 在 数 十 万 条 洪流 中 积极 
地 共享 文件 。 如 果 BitTorrent 被 设计 为 不 采用 一 报 还 一 报 〈 或 一 种 变种 ) ， 然 而 在 别 的 方面 
却 完全 相同 的 协议 ，BitTorrent 现在 将 很 可 能 不 复 存 在 了 ， 因 为 大 多 数 用 户 将 成 为 搭便 车 
者 了 | Sarouiu 2002 | 。 

我 们 简要 地 提 一 下 男 一 种 P2P 应 用 一 一 分 布 式 散 列 表 (DHT) 来 结束 我 们 的 讨论 。 分 
布 式 散 列表 是 一 种 简单 的 数据 库 ， 其 数据 库 记 录 分 布 在 一 个 P2P 系统 的 多 个 对 等 方 上 。 
DHT 得 到 了 广泛 实现 (如 在 BitTorrent 中 ) ， 并 成 为 大 量 研 究 的 主题 。 在 配套 网 站 的 Video 
Note 中 对 DHT 进行 了 概述 。 


2.6 视频 流 和 内 容 分 发 网 


事先 录制 的 流 式 视频 现在 是 北美 住宅 ISP 中 的 流量 主体 。 特 别 是 ，Netflix 和 YouTube 
在 2015 年 分 别 消耗 了 住宅 ISP 流量 的 37% 和 16% [Sandvine 2015 ] 。 在 本 节 中 ， 我 们 将 对 
如 何在 今天 的 因特网 中 实现 流行 的 视频 流 服务 进行 概述 。 我 们 将 看 到 它们 的 实现 方式 是 使 
用 应 用 层 协 议和 以 像 高 速 缓存 那样 方式 运行 的 服务 器 。 在 专注 于 多 媒体 网 络 的 第 9 章 中 ， 
我 们 将 进一步 研究 因特网 视频 以 及 其 他 因特网 多 媒体 服务 。 


2.6.1 因特网 视频 


在 流 式 存储 视频 应 用 中 ， 基 础 的 媒体 是 预先 录制 的 视频 ， 例 如 电影 、 电 视 节 目 、 录 制 
好 的 体育 事件 或 录制 好 的 用 户 生成 的 视频 (如 通常 在 YouTube 上 可 见 的 那些 )。 这 些 预先 
录制 好 的 视频 放置 在 服务 右上， 用 户 按 需 向 这 些 服务 器 发 送 请 求 来 观看 视频 。 许 多 因特网 
公司 现在 提供 流 式 视频 ， 这 些 公 司 包括 Netflix, YouTube (谷歌 )、 亚 蕊 还 和 优酷 。 

但 在 开始 讨论 视频 流 之 前 ， 我 们 先 迅 速 感受 一 下 视频 媒体 自身 。 视 频 是 一 系列 的 图 像 ， 
通常 以 一 种 恒定 的 速率 ( 如 每 秒 24 或 30 张 图 像 ) 来 展现 。 一 幅 未 压缩 、 数 字 编 码 的 图 像 由 
像素 阵列 组 成 ， 其 中 每 个 像素 是 由 一 些 比特 编码 来 表示 亮度 和 颜色 。 视 频 的 一 个 重要 特征 是 
它 能 够 被 压缩 ， 因 而 可 用 比特 率 来 权衡 视频 质量 。 今 天 现成 的 压缩 算法 能 够 将 一 个 视频 压缩 
成 所 布 望 的 任何 比特 率 。 当 然 ， 比 特 率 越 高 ， 图 像 质量 越 好 ， 用 户 的 总 体 视 觉 感受 越 好 。 

从 网 络 的 观点 看 ， 也 许 视频 最 为 突出 的 特征 是 它 的 高 比特 率 。 压 缩 的 因特网 视频 的 比 
特 率 范围 通常 从 用 于 低 质 量 视频 的 100kbps， 到 用 于 流 式 高 分 辨 率 电 影 的 超过 3Mbps， 再 
到 用 于 4K 流 式 展望 的 超过 10Mbps。 这 能 够 转换 为 巨大 的 流量 和 存储 ， 特 别 是 对 高 端 视 
频 。 例 如 ， 单 一 2Mbps 视频 在 67 分 钟 期 间 将 耗费 1CB 的 存储 和 流量 。 到 目前 为 止 ， 对 流 
式 视 频 的 最 为 重要 的 性 能 度量 是 平均 端 到 端 吞 吐 量 。 为 了 提供 连续 不 断 的 布局 ， 网 络 必须 
为 流 式 应 用 提供 平均 吞吐 量 ， 这 个 流 式 应 用 至 少 与 压缩 视频 的 比特 率 一 样 大 。 

我 们 也 能 使 用 压缩 生成 相同 视频 的 多 个 版 本 ， 每 个 版 本 有 不 同 的 质量 等 级 。 例 如 ， 我 
们 能 够 使 用 压缩 生成 相同 视频 的 3 个 版 本 ， 比 特 率 分 别 为 300kbps、1Mbps 和 3Mbps。 用 户 


则 能 够 根据 他 们 当前 可 用 带宽 来 决定 观看 哪个 版 本 。 具 有 高 速 因 特 网 连接 的 用 户 也 许 选 择 
3Mbps 版 本 ， 使 用 智能 手机 通过 3G 观看 视频 的 用 户 可 能 选择 300kbps 版 本 。 


2.6.2 HTTP 流 和 DASH 


在 HTTP 流 中 ， 视 频 只 是 存储 在 HTTP 服务 器 中 作为 一 个 普通 的 文件 ， 每 个 文件 有 一 
个 特定 的 URL。 当 用 户 要 看 该 视频 时 ， 客 户 与 服务 器 创建 一 个 TCP 连接 并 发 送 对 该 URL 
的 HTTP GET 请 求 。 服 务 器 则 以 底层 网 络 协议 和 流量 条 件 允 许 的 尽 可 能 快 的 速率 ， 在 一 个 
HTTP 响应 报 文中 发 送 该 视频 文件 。 在 客户 一 侧 ， 字 节 被 收集 在 客户 应 用 缓存 中 。 一 旦 该 
缓存 中 的 字 节 数量 超过 预先 设 定 的 门限 ， 客 户 应 用 程序 就 开始 播放 ， 特 别 是 ， 流 式 视频 应 
用 程序 周期 性 地 从 客户 应 用 程序 缓存 中 抓 取 帧 ， 对 这 些 帧 解压 缩 并 且 在 用 户 屏幕 上 展现 。 
因此 ， 流 式 视频 应 用 接收 到 视频 就 进行 播放 ， 同 时 缓存 该 视频 后 面部 分 的 帧 。 

如 前 一 小 节 所 述 ， 尽 管 HTTP 流 在 实践 中 已 经 得 到 广泛 部 署 ( 例 如 ， 自 YouTube 发 展 
初期 开始 ) ， 但 它 具 有 严重 缺陷 ， 即 所 有 客户 接收 到 相同 编码 的 视频 ， 尽 管 对 不 同 的 客户 
或 者 对 于 相同 客户 的 不 同时 间 而 言 ， 客 户 可 用 的 带宽 大 小 有 很 大 不 同 。 这 导致 了 一 种 新 型 
基于 HTTP 的 流 的 研发 ， 它 常常 被 称 为 经 HTTP 的 动态 适应 性 流 (Dynamic Adaptive 
Streaming over HTTP，DASH) 。 在 DASH 中 ， 视 频 编码 为 几 个 不 同 的 版 本 ， 其 中 每 个 版 本 
具有 不 同 的 比特 率 ， 对 应 于 不 同 的 质量 水 平 。 客 户 动态 地 请 求 来 自 不 同 版 本 且 长 度 为 几 秒 
的 视频 段 数据 块 。 当 可 用 带宽 量 较 高 时 ， 客 户 自然 地 选择 来 自 高 速率 版 本 的 块 ; 当 可 用 带 
宽 量 较 低 时 ， 客 户 自然 地 选择 来 自 低速 率 版 本 的 块 。 客 户 用 HTTP GET 请 求 报 文 一 次 选择 
一 个 不 同 的 块 『 Akhshabi 2011 ] 。 

DASH 允许 客户 使 用 不 同 的 以 太 网 接 入 速率 流 式 播放 具有 不 同 编码 速率 的 视频 。 使 用 
低速 3G 连接 的 客户 能 够 接收 一 个 低 比 特 率 ( 和 低 质 量 ) 的 版 本 ， 使 用 光纤 连接 的 客户 能 
够 接收 高 质量 的 版 本 。 如 果 端 到 端 带 宽 在 会 话 过 程 中 改变 的 话 ，DASH 允许 客户 适应 可 用 
带宽 。 这 种 特色 对 于 移动 用 户 特别 重要 ， 当 移动 用 户 相 对 于 基站 移动 时 ， 通 第 他 们 能 感受 
到 其 可 用 带宽 的 波动 。 

使 用 DASH 后 ， 每 个 视频 版 本 存储 在 HTTP 服务 器 中 ,每 个 版 本 都 有 一 个 不 同 的 
URL, HTTP 服务 器 也 有 一 个 告示 文件 (manifest file)， 为 每 个 版 本 提供 了 一 个 URL 及 其 
比特 率 。 客 户 首先 请 求 该 告示 文件 并 且 得 知 各 种 各 样 的 版 本 。 然 后 客户 通过 在 HTTP GET 
请 求 报 文中 对 每 块 指定 一 个 URL 和 一 个 字 节 范围 ， 一 次 选择 一 块 。 在 下 载 块 的 同时 ， 客 
户 也 测量 接收 带宽 并 运行 一 个 速率 决定 算法 来 选择 下 次 请 求 的 块 。 自 然 地 ， 如 果 客 户 缓存 
的 视频 很 多 ， 并 且 测 量 的 接收 带宽 较 高 ， 它 将 选择 一 个 高 速率 的 版 本 。 同 样 ， 如 果 客 户 组 
存 的 视频 很 少 ， 并 且 测 量 的 接收 带宽 较 低 ， 它 将 选择 一 个 低速 率 的 版 本 。 因 此 DASH 允许 
客户 自由 地 在 不 同 的 质量 等 级 之 间 切 换 。 


2. 6.3 内 容 分 发 网 


今天 ， 许 多 因特网 视频 公司 日 复 一 日 地 向 数 以 百 万 计 的 用 户 按 需 分 发 每 秒 数 兆 比 特 的 
流 。 例 如 ，YouTube 的 视频 库 藏 有 几 亿 个 ， 每 天 向 全 世界 的 用 户 分 发 几 亿 条 流 。 回 位 于 全 世 
界 的 所 有 用 户 流 式 传输 所 有 流量 同时 提供 连续 播放 和 高 交互 性 显然 是 一 项 有 挑战 性 的 任务 。 

对 于 一 个 因特网 视频 公司 ,或 许 提供 流 式 视频 服务 最 为 直接 的 方法 是 建立 单一 的 大 规 
模 数据 中 心 ， 在 数据 中 心中 存储 其 所 有 视频 ， 并 直接 从 该 数据 中 心 向 世界 范围 的 客户 传输 
流 式 视频 。 但 是 这 种 方法 存在 三 个 问题 。 首 先 ， 如 果 客 户 远离 数据 中 心 ， 服 务 顺 到 客户 的 
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分 组 将 跨越 许多 通信 链 路 并 很 可 能 通过 许多 ISP, HPR ISP 可 能 位 于 不 同 的 大 洲 。 如 
果 这 些 链 路 之 一 提供 的 吞吐 量 小 于 视频 消耗 速率 ， 端 到 端 吞 吐 量 也 将 小 于 该 消耗 速率 ， 给 
用 户 带 来 恼人 的 停滞 时 延 。( 第 1 章 讲 过 ， 一 条 流 的 端 到 端 吞 吐 量 由 瓶颈 链 路 的 吞吐 量 所 
决定 。) 出 现 这 种 事件 的 可 能 性 随 着 端 到 端 路 径 中 链 路 数量 的 增加 而 增加 。 第 二 个 缺陷 是 
流行 的 视频 很 可 能 经 过 相同 的 通信 链 路 发 送 许 多 次 。 这 不 仅 浪 费 了 网 络 带宽 ， 因 特 网 视频 
公司 自己 也 将 为 向 因特网 反复 发 送 相同 的 字 节 而 向 其 ISP 运营 商 (连接 到 数据 中 心 ) 支付 
费用 。 这 种 解决 方案 的 第 三 个 问题 是 单个 数据 中 心 代 表 一 个 单 点 故障 ， 如 果 数 据 中 心 或 其 
通 向 因特网 的 链 路 前 溃 ， 它 将 不 能 够 分 发 任何 视频 流 了 。 

为 了 应 对 向 分 布 于 全 世界 的 用 户 分 发 巨 量 视频 数据 的 挑战 ， 几 乎 所 有 主要 的 视频 流 公 
司 都 利用 内 容 分 发 网 (Content Distribution Network, CDN), CDN 管理 分 布 在 多 个 地 理 位 置 
上 的 服务 器 ， 在 它 的 服务 器 中 存储 视频 (和 其 他 类 型 的 Web 内容， 包括 文档 、 图 片 和 音 
频 ) 的 副本 ， 并 且 所 有 试图 将 每 个 用 户 请 求 定 向 到 一 个 将 提供 最 好 的 用 户 体验 的 CDN 位 
置 。CDN 可 以 是 专用 CDN (private CDN) ， 即 它 由 内 容 提供 商 自 己 所 拥有 ; 例如 ,谷歌 的 
CDN 分 发 YouTube 视频 和 其 他 类 型 的 内 容 。 男 一 种 CDN 可 以 是 第 三 方 CDN (third-party 
CDN) ， 它 代表 多 个 内 容 提 供 商 分 发 内 容 ; Akamai, Limelight 和 Level-3 都 运行 第 三 方 
CDN。 现 代 CDN 的 一 个 可 读 性 强 的 展望 见 [Leighton 2009; Nygren 2010] 。 





谷歌 的 网 络 基础 设施 


为 了 支持 谷歌 的 巨 量 云 服务 阵列 ， 包 括 搜 索 、Gmail、 日 程 表 、YouTube 视频 、 地 

图 、 文 档 和 社交 网 络 ， 谷 歌 已 经 部 署 了 一 个 广泛 的 专用 网 和 CDN 基础 设施 。 谷 歌 的 

CDN 基础 设施 具有 三 个 等 级 的 服务 器 集群 . 

© 14 个 “ 百 万 数据 中 心 "”， 其 中 8 个 位 于 北美 ，4 个 位 于 欧洲 ，2 个 位 于 亚洲 [Google 
Locations 2016] ， 每 个 数据 中 心 具有 10 万 台 量 级 的 服务 器 。 这 些 “ 百 万 数据 中 心 ” 
负责 服务 于 动态 的 (并 且 经 常 是 个 性 化 的 ) 内 容 ， 包 括 搜 索 结果 和 Gmail 报 文 。 

© 在 IXP 中 大 约 50 个 集群 分 布 于 全 球 ， 其 中 每 个 集群 由 100 ~500 台 服 务 器 组 成 
[ Adhikari 2011a] 。 这 些 集群 负责 服务 于 静态 内 容 ， 包 括 YouTube 视频 [Adhikari 
2011a ] . 

e 数 以 百 计 的 “深入 (enter-deep)” 集 群 位 于 一 个 接 入 ISP 中 。 这 里 一 个 集群 通 
常 由 位 于 一 个 机 架 上 的 数 十 台 服 务 器 组 成 。 这 些 “ 深 入 服务 器 ”执行 TCP A 
(参见 3.7 节 ) 并 服务 于 静态 内 容 [Chen 2011] ， 包 括 体 现 搜索 结果 的 Web 网 
页 的 静态 部 分 ，。 

所 有 这 些 数据 中 心 和 集群 位 置 与 谷歌 自己 的 专用 网 连接 在 一 起 。 当 某 用 户 进 行 搜索 

| 请 求 时 ， 该 请 求 常常 先 经 过 本 地 ISP 发 送 到 邻近 的 “深入 服务 器 ”缓存 中 ， 从 这 里 检索 

静态 内 容 ; 同时 将 该 静态 内 容 提供 给 客户 ， 邻 近 的 缓存 也 经 谷歌 的 专用 网 将 请 求 转发 给 

“大 型 数据 中 心 ”"， 从 这 里 检索 个 性 化 的 搜索 结果 。 对 于 某 YouTube 视频 ， 该 视频 本 身 可 

能 来 自 一 个 “邀请 坐 客服 务 器 ”缓存 ， 而 围绕 该 视频 的 Web 网 页 部 分 可 能 来 自 邻 近 的 

“深入 服务 器 ”缓存 ， 围 绕 该 视频 的 广告 来 自 数 据 中 心 。 总 的 来 说 ， 除 了 本 地 ISP， 合 

歌 云 服务 在 很 大 程度 上 是 由 独立 于 公共 因特网 的 网 络 基 础 设施 提供 的 。 
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CDN 通常 采用 两 种 不 同 的 服务 器 安置 原则 | Huang 2008 | : 
e。 深入 。 第 一 个 原则 由 Akamai 首创 ， 该 原则 是 通过 在 遍及 全 球 的 接 入 ISP 中 部 署 服 
务 器 集群 来 深入 到 ISP 的 接 人 网 中 。( 在 1.3 节 中 描述 了 接 入 网 。) Akamai 在 大 约 
1700 个 位 置 采 用 这 种 方法 部 署 集群 。 其 目标 是 靠近 端 用 户 ， 通 过 减少 端 用 户 和 
CDN 集群 之 间 〈 内 容 从 这 里 收 到 ) 链 路 和 路 由 器 的 数量 ， 从 而 改善 了 用 户 感受 的 
时 延 和 吞吐 量 。 因 为 这 种 高 度 分 布 式 设计 ， 维 护 和 管理 集群 的 任务 成 为 挑战 。 
。 邀请 做 客 。 第 二 个 设计 原则 由 Limelight 和 许多 其 他 CDN 公司 所 采用 ， 该 原则 是 通 
过 在 少量 (例如 10 个 ) 关键 位 置 建 造 大 集群 来 邀请 到 ISP 做 客 。 不 是 将 集群 放 在 
接 入 ISP 中 ， 这 些 CDN 通常 将 它们 的 集群 放置 在 因特网 交换 点 (IXP) (参见 1.3 
节 ) 。 与 深入 设计 原则 相 比 ， 邀 请 做 客 设计 通常 产生 较 低 的 维护 和 管理 开销 ， 可 能 
以 对 端 用 户 的 较 高 时 延 和 较 低 吞吐 量 为 代价 。 
一 旦 CDN 的 集群 准备 就 绪 ， 它 就 可 以 路 集群 复制 内 容 。CDN 可 能 不 希望 将 每 个 视频 
的 副本 放置 在 每 个 集群 中 ， 因 为 某 些 视频 很 少 观看 或 仅 在 某 些 国家 中 流行 。 事 实 上 ， 许 多 
CDN 没有 将 视频 推 人 它们 的 集群 ， 而 是 使 用 一 种 简单 的 拉 策 略 : 如 果 客 户 向 一 个 未 存储 该 
视频 的 集群 请 求 某 视 频 ， 则 该 集群 检索 该 视频 (从 某 中 心 仓 库 或 者 从 另 一 个 集群 ) ， 回 客 
户 流 式 传输 视频 时 的 同时 在 本 地 存储 一 个 副本 。 类 似 于 因特网 缓存 (参见 2.2.5 市 )， 当 
某 集群 存储 器 变 满 时 ， 它 删除 不 经 党 请求 的 视频 。 
1. CDN 操作 


在 讨论 过 这 两 种 部 署 CDN 的 重要 方法 后 ,我 们 现在 深入 看 看 CDN 操作 的 细节 。 当 用 
户主 机 中 的 一 个 浏览 器 指令 检索 一 个 特定 的 视频 (由 URL 标识 ) 时 ，CDN 必须 截获 该 请 
求 ， 以 便 能 够 : 中 确定 此 时 适合 用 于 该 客户 的 CDN 服务 器 集群 ; 人 @) 将 客户 的 请 求 重 定 回 
到 该 集群 的 某 台 服务 器 。 我 们 很 快 将 讨论 CDN 是 如 何 能 够 确定 一 个 适当 的 集群 的 。 但 是 
我 们 首先 考察 截获 和 重 定向 请 求 所 依赖 的 机 制 。 

大 多 数 CDN 利用 DNS 来 截获 和 重 





定向 请 求 ， 这 种 使 用 DNS 的 一 个 有 趣 e 
讨论 见 【 Vixie 2009] 。 我 们 考虑 用 一 个 一 里 
简单 的 例子 来 说 明 通 常 是 怎样 涉及 DNS (1) www. NetCinema.com 
的 。 假 定 一 个 内 容 提 供 商 NetCinema, Ai 





雇佣 了 第 三 方 CDN 公司 KingCDN 来 向 D om 
其 客户 分 发 视频 。 在 NetCinema 的 Web E- 








.是 
网 页 上 ， 它 的 每 个 视频 都 被 指派 了 一 个 hite GC, TRR 
URL, URL 包括 了 字符 串 “video” 
以 及 该 视频 本 身 的 独特 标识 符 ; 例如 ， .一 
转换 器 7 可 以 指派 为 http:/video. | | | KingCDN 权 威 
netcinema. com/6Y7B23V。 接 下 来 出 现 KingCDN 内 分 发 服务 器 服务 器 


如 图 2-24 所 示 的 6 个 步骤 : 

1) 用 户 访 问 位 于 NetCinema fy 图 2-24 DNS 将 用 户 的 请 求 重 定向 到 一 台 CDN 服务 器 
Web 网 页 。 

2) 当 用 户 点 击 链接 http: //video. netcinema. com/6Y7B23V 时 ， 该 用 户主 机 发 送 了 一 个 


对 于 video. netcinema. com 的 DNS 请 求 。 

3) 用 户 的 本 地 DNS 服务 器 (LDNS) 将 该 DNS 请 求 中 继 到 一 台 用 于 NetCinema 的 权 
A DNS 服务 器 ， 该 服务 器 观察 到 主机 名 video. netcinema. com 中 的 字符 串 “video”。 为 了 将 
该 DNS 请 求 移 交 给 KingCDN NetCinema 权威 DNS 服务 需 并 不 返回 一 个 卫 地 址 ， 而 是 回 
LDNS 返回 一 个 KingCDN 域 的 主机 名 ， 如 al105. kingcdn. com, 

4) 从 这 时 起 ，DNS 请 求 进 入 了 KingCDN 专用 DNS 基础 设施 。 用 户 的 LDNS 则 发 送 第 
二 个 请 求 ， 此 时 是 对 al 105. kingedn. com 的 DNS 请 求 ，KingCDN 的 DNS 系统 最 终 向 LDNS 
返回 KingCDN 内 容 服务 器 的 卫 地址 。 所 以 正 是 在 这 里 ， 在 KingCDN 的 DNS 系统 中 ， 指 定 
了 CDN 服务 器 ， 客 户 将 能 够 从 这 人 台 服 务 器 接收 到 它 的 内 容 。 

5) LDNS 向 用 户主 机 转发 内 容 服 务 CDN 节点 的 IP 地 址 。 

6) 一 旦 客户 收 到 KingCDN 内 容 服 务 器 的 IP 地 址 ， 它 与 具有 该 IP 地 址 的 服务 器 创建 
了 一 条 直接 的 TCP 连接 ， 并 且 发 出 对 该 视频 的 HTTP GET 请 求 。 如 果 使 用 了 DASH ， 服 务 
arts A cll PAGOSA URL 列表 的 告示 文件 ， 每 个 URL 对 应 视频 的 每 个 版 本 ， 并 且 客 
户 将 动态 地 选择 来 目 不 同 版 本 的 块 。 

2. 集群 选择 策略 


任何 CDN 部 署 ， 其 核心 是 集群 选择 策略 (cluster selection strategy ) ， 即 动态 地 将 客户 
定向 到 CDN 中 的 某 个 服务 需 集 群 或 数据 中 心 的 机 制 。 如 我 们 刚才 所 见 ， 经 过 客户 的 DNS 
查找 ，CDN 得 知 了 该 客户 的 LDNS 服务 器 的 IP 地 址 。 在 得 知 该 P 地 址 之 后 ，CDN 需要 基 
于 该 P 地 址 选择 一 个 适当 的 集群 。CDN 一 般 采 用 专用 的 集群 选择 策略 。 我 们 现在 简单 地 
介绍 一 些 策略 ， 每 种 策略 都 有 其 优点 和 缺点 。 

一 种 简单 的 策略 是 指派 客户 到 地 理 上 最 为 邻近 (geographically closest) 的 集群 。 使 用 
商用 地 理 位 置 数据 库 (例如 Quova [ Quova 2016] 和 Max- Mind [ MaxMind 2016 ] ) ， 每 个 
LDNS IP 地 址 都 映射 到 一 个 地 理 位 置 。 当 从 一 个 特殊 的 LDNS 接收 到 一 个 DNS 请 求 时 ， 
CDN 选择 地 理 上 最 为 接近 的 集群 ， 即 离 LDNS 最 少 几 千 米 远 的 集群 , “就 像 鸟 飞 一 样 " 。 这 
样 的 解决 方案 对 于 众多 用 户 来 说 能 够 工作 得 相当 好 [Agarwal 2009 ] 。 但 对 于 某 些 客户 ， 该 
解决 方案 可 能 执行 的 效果 差 ， 因 为 就 网 络 路 径 的 长 度 或 跳 数 而 言 ， 地 理 最 邻近 的 集群 可 能 
并 不 是 最 近 的 集群 。 此 外 ， 一 种 所 有 基于 DNS 的 方法 都 内 在 具有 的 问题 是 ， 某 些 端 用 户 
配置 使 用 位 于 远 地 的 LDNS [Shaikh 2001; Mao 2002 | ， 在 这 种 情况 下 ，LDNS 位 置 可 能 远 
离 客户 的 位 置 。 此 外 ， 这 种 简单 的 策略 忽略 了 时 延 和 可 用 带宽 随 因 特 网 路 径 时 间 而 变化 ， 
总 是 为 特定 的 客户 指派 相同 的 集群 。 

为 了 基于 当前 流量 条 件 为 客户 决定 最 好 的 集群 ，CDN 能 够 对 其 集群 和 客户 之 间 的 时 延 
和 丢 包 性 能 执行 周期 性 的 实时 测量 (real-time measurement), Hin, CDN 能 够 让 它 的 每 个 
集群 周期 性 地 向 位 于 全 世界 的 所 有 LONS 发 送 探 测 分 组 (例如 ，ping 报 文 或 DNS 请 求 ) 。 
这 种 方法 的 一 个 缺点 是 许多 LDNS 被 配置 为 不 会 响应 这 些 探测 。 


2.6.4 学 习 案 例 : Netflix, YouTube 和 “看 看 ” 

通过 观察 三 个 高 度 成 功 的 大 规模 部 署 Netflix, YouTube 和 “看 看 ”， 我 们 来 总 结对 流 
式 存 储 视频 的 讨论 。 我 们 将 看 到 ， 这 些 系 统 采用 的 方法 差异 很 大 ， 但 却 应 用 了 在 本 节 中 讨 
论 的 许多 根本 原则 。 

1. Netflix 


Netflix 在 2015 年 产生 了 37% 的 北美 住宅 ISP 中 的 下 载 流 量 ， 它 已 经 成 为 美国 首届 一 
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指 的 在 线 电影 和 TYV 节目 的 服务 提供 商 [Snadvine 2015 ] 。 如 我 们 下 面 讨论 的 那样 ，Netflix 
视频 分 发 具有 两 个 主要 部 件 : 亚马逊 云 和 它 目 己 的 专用 CDN 基础 设施 。 

Netflix 有 一 个 Web 网 站 来 处 理 知 干 功能 ， 这 些 功 能 包括 用 户 注册 和 登录 、 计 费 、 用 于 
浏览 和 搜索 的 电影 目录 以 及 一 个 电影 推荐 系统 。 如 图 2-25 所 示 ， 这 个 Web 网 站 (URE 
关联 的 后 端 数据 库 ) 完全 运行 在 亚马逊 云 中 的 亚马逊 服务 器 上 。 此 外 ， 亚 马 逊 云 处 理 下 列 
关键 功能 : 

© 内 容 摄 取 。 在 Netflix 能 够 向 它 的 用 户 分 发 某 电 影 之 前 ， 它 必须 首先 获取 和 处 理 该 

电影 。Netflix 接收 制 片 三 电影 的 母 带 ， 并 且 将 其 上 载 到 亚马逊 云 的 主机 上 。 

© 内 容 处 理 。 亚 马 撑 云 中 的 机 融 为 每 部 电影 生成 许多 不 同 格式 ， 以 适合 在 桌面 计算 

机 、 智 能 手机 和 与 电视 机 相连 的 游戏 机 上 运行 的 不 同类 型 的 客户 视频 播放 髓 。 为 
每 种 格式 和 比特 率 都 生成 一 种 不 同 的 版 本 ， 人 允许 使 用 DASH 经 HTTP 适应 性 播 
放流 。 

e 向 其 CDN 上 载 版 本 。 一旦 某 电影 的 所 有 版 本 均 已 生成 ， 在 亚 马 还 云 中 的 主机 向 其 
CDN 上 载 这 些 版 本 。 
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图 2-25 Netflix 视频 流 平台 


当 Netflix 于 2007 年 首次 推出 它 的 视频 流 式 服务 时 ， 它 雇佣 了 3 个 第 三 方 CDN 公司 来 
分 发 它 的 视频 内 容 。 自 那 时 起 ，Netflix 创建 了 自己 专用 的 CDN， 现 在 它 从 这 些 专用 CDN 
发 送 它 所 有 的 视频 。( 然而 ，Netflix 仍 使 用 Akamai 来 分 发 它 的 Web 网 页 。) 为 了 创建 它 自 
CLAY CDN, Netflix 在 IXP 和 它们 自己 的 住宅 ISP 中 安装 了 服务 器 机 架 。Netflix 当前 在 超过 
50 个 IXP 位 置 具 有 服务 器 机 架 ， 存放 Netflix 机 架 的 IXP 清单 可 参见 [Netflix Open Connect 
2016 ] 。 也 有 数 百 个 ISP 位 置 存放 Netflix 机 架 ， 同 样 可 参见 | Netflix Open Connect 2016 | , 
其 中 Netflix 向 潜在 的 ISP 合作 伙伴 提供 了 在 其 网 络 中 安装 一 个 (人 免费) Netflix 机 架 的 操作 
指南 。 在 机 架 中 每 台 服 务 器 具有 几 个 10Gbps 以 太 网 端口 和 超过 100TB 的 存储 。 在 一 个 机 
架 中 服务 器 的 数量 是 变化 的 : IXP 安装 通常 有 数 十 台 服 务 器 并 包含 整个 Netflix 流 式 视频 库 
(包括 多 个 版 本 的 视频 以 支持 DASH) ; 本 地 IXP 也 许 仅 有 一 台 服 务 器 并 仅 包含 最 为 流行 的 
视频 。Netflix 不 使 用 拉 高 速 缓 存 (2.2.5 节 ) 以 在 IXP 和 ISP 中 扩充 它 的 CDN ARG AE, FZ 
而 在 非 高 峰 时 段 通过 推 将 这 些 视 频 分 发 给 它 的 CDN 服务 器 。 对 于 不 能 保存 整个 库 的 那些 


位 置 ，Netflix 仅 推送 最 为 流行 的 视频 ， 视 频 的 流行 度 是 基于 逐 天 的 数据 来 决定 的 。 在 You- 
Tube 视频 ( | Netflix Video 1] 和 [ Netflix Video 2]) 中 更 为 详细 地 描述 了 Netflix CDN 
设计 。 

描述 了 Netflix 体系 结构 的 组 件 后 ， 我 们 来 更 为 仔细 地 看 一 下 客户 与 各 台 服 务 需 之 
间 的 交互 ， 这 些 服务 器 与 电影 交付 有 关 。 如 前 面 指出 的 那样 ， 浏 览 Netflix 视频 库 的 
Web 网 页 由 亚马逊 云 中 的 服务 器 提供 服务 。 当 用 户 选 择 一 个 电影 准备 播放 时 ， 运 行 在 
亚马逊 云 中 的 Netflix 软件 首先 确定 它 的 哪个 CDN 服务 器 具有 该 电影 的 拷贝 。 在 具有 
拷贝 的 服务 器 中 ， 该 软件 决定 客户 请 求 的 “最 好 的 ”服务 器 。 如 果 该 客户 正在 使 用 
一 个 住宅 ISP， 它 具有 安装 在 该 ISP 中 Netflix CDN 服务 器 机 架 并 且 该 机 架 具 有 所 请 求 
电影 的 拷贝 ， 则 通常 选择 这 个 机 架 中 的 一 台 服 务 器 。 倘 若 不 是 ， 通 常 选择 邻近 XP 的 
— FAR iko 

— H Netflix 确定 了 交付 内 容 的 CDN 服务 器 ， 它 向 该 客户 发 送 特定 服务 器 的 IP 地 址 以 
及 资源 配置 文件 ， 该 文件 具有 所 请 求 电 影 的 不 同 版 本 的 URL。 该 客户 和 那 台 CDN 服务 器 
则 使 用 专用 版 本 的 DASH 进行 交互 。 具 体 而 言 ， 如 2. 6. 2 节 所 述 ， 该 客户 使 用 HTTP GET 
请 求 报 文中 的 字 节 范围 首部 ， 以 请 求 来 自 电 影 的 不 同 版 本 的 块 。Netflix 使 用 大 约 4 秒 长 的 
k [Adhikari 2012 ] 。 随 着 这 些 块 的 下 载 ， 客 户 测量 收 到 的 吞吐 量 并 且 运 行 一 个 速率 确定 
算法 来 确定 下 一 个 要 请 求 块 的 质量 。 

Netflix 包含 了 本 节 前 面 讨 论 的 许多 关键 原则 ， 包 括 适 应 性 流 和 CDN 分 发 。 然 而 ， 因 
为 Netflix 使 用 自己 专用 的 CDN ， 而 它 仅 分 发 视频 (而 非 Web 网 页 ) ATLA Netflix 已 经 能 够 
简化 并 定制 其 CDN iit. FRSA, Netflix 不 需要 用 如 2. 6.3 节 中 所 讨论 的 DNS He IK 
将 特殊 的 客户 连接 到 一 台 CDN 服务 器 ; 相反 ，Netflix 软件 〈 运 行 在 亚马逊 云 中 ) 直接 告 
知 该 客户 使 用 一 台 特 定 的 CDN ARB AE. Wah, Netflix CDN 使 用 推 高 速 缓存 而 不 是 拉 高 速 
缓存 (2.2.5 49): 内 容 在 非 高 峰 时 段 的 预定 时 间 被 推 人 服务 器 ， 而 不 是 在 高 速 缓存 未 命 
中 时 动态 地 被 推 人 。 

2. YouTube 


YouTube 具有 每 分 钟 300 小 时 的 视频 上 载 和 每 天 几 十 亿 次 观看 [YouTube 2016] , Z5 
疑问 YouTube 是 世界 上 最 大 的 视频 共享 站 点 。YouTube 于 2005 年 4 月 开始 它 的 服务 ， 并 于 
2006 年 11 月 被 谷歌 公司 收购 。 尽 管 谷歌 /YouTube 设计 和 协议 是 专用 的 ， 但 通过 几 个 独立 
的 测量 结果 ， 我 们 能 够 基本 理解 YouTube 的 工作 原理 | Zink 2009; Torres 2011; Adhikari 
2011a]。 与 Netflix —##, YouTube 广泛 地 利用 CDN 技术 来 分 发 它 的 视频 [Torres 2011 |, 
类 似 于 Netfix， 谷 歌 使 用 其 专用 CDN 来 分 发 YouTube 视频 ， 并 且 已 经 在 几 百 个 不 同 的 IXP 
和 ISP 位 置 安装 了 服务 器 集群 。 从 这 些 位 置 以 及 从 它 的 巨大 数据 中 心 ， 谷 歌 分 发 YouTube 
视频 | Adhikari 2011a] 。 然 而 ， 与 Netflix 不 同 ， 谷 歌 使 用 如 2. 2. 5 节 中 描述 的 拉 高 速 缓 存 
和 如 2. 6. 3 节 中 描述 的 DNS 重 定 回 。 在 大 部 分 时 间 ， 谷 歌 的 集群 选择 策略 将 客户 定向 到 某 
个 集群 ， 使 得 客户 与 集群 之 间 的 RTT 是 最 低 的 。 然 而 ， 为 了 平衡 流 经 集群 的 负载 ， 有 时 客 
PRE (经 DNS) 到 一 个 更 远 的 集群 [Torres 2011 ] 。 

YouTube 应 用 HTTP 流 ， 经 常 使 少量 的 不 同 版 本 为 一 个 视频 可 用 ， 每 个 具有 不 同 的 比 
特 率 和 对 应 的 质量 等 级 。YouTube 没有 应 用 适应 性 流 〈 例 如 DASH), ， 而 要 求 用 户 人 工 选择 
一 个 版 本 。 为 了 节省 那些 将 被 重 定位 或 提前 终止 而 浪费 的 带宽 和 服务 器 资源 ，YouTube 在 
获取 视频 的 目标 量 之 后 ， 使 用 HTTP 字 节 范围 请 求 来 限制 传输 的 数据 流 。 
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每 天 有 几 百 万 视频 被 上 载 到 YouTube, PAX YouTube 视频 经 HTTP 以 流 方式 从 服务 
器 到 客户 ， 而 且 YouTube 上 载 者 也 经 HTTP 从 客户 到 服务 器 上 载 他 们 的 视频 。YouTube 
处 理 它 收 到 的 每 个 视频 ， 将 它 转 换 为 YouTube 视频 格式 并 且 创 建 具 有 不 同比 特 率 的 多 个 
版 本 。 这 种 处 理 完 全 发 生 在 谷歌 数据 中 心 。( 人 参见 2. 6.3 节 中 有 关 谷 歌 的 网 络 基础 设施 
的 学 习 案 例 。) 

3. 看 看 

我 们 刚 讨论 了 由 专用 CDN 运行 的 专用 服务 器 以 流 的 方式 向 客户 发 送 Netflix 和 YouTube 
视频 。Netflix 和 YouTube 不 仅 必 须 为 服务 器 硬件 付费 ， 而 且 要 为 服务 器 分 发 视频 时 使 用 的 
带宽 付费 。 考 虑 到 这 些 服 务 的 规模 和 它们 消耗 的 带宽 量 ， 这 种 CDN 部 署 的 代价 可 能 是 很 
高 的 。 

我 们 通过 描述 一 种 完全 不 同 的 方法 来 对 本 节 进 行 总 结 ， 即 经 因特网 大 规模 地 按 需 提供 
视频 。 这 是 一 种 允许 服务 提供 商 极 大 地 减少 其 基础 设施 和 带宽 成 本 的 方法 。 如 你 可 能 猜测 
的 那样 ， 这 种 方法 使 用 PP 交付 而 不 是 客户 - 服务 器 交付 。 自 2011 EUX, AA (AM 
雷公 司 拥有 并 运行 ) MAA PP 视频 交付 取得 了 巨大 的 成 功 ， 每 个 月 都 有 数 千 万 用 户 
[ Zhang 2015 | 。 

从 高 层面 看 ，P2P 流 式 视频 非常 类 似 于 BitTorrent 文件 下 载 。 当 一 个 对 等 方 要 看 一 
个 视频 时 ， 它 联系 一 个 跟踪 器 ， 以 发 现在 系统 中 具有 该 视频 副本 的 其 他 对 等 方 。 这 个 请 
求 的 对 等 方 则 并 行 地 从 具有 该 文件 的 其 他 对 等 方 请 求 该 视频 的 块 。 然 而 ,不 同 于 使 用 
BitTorrent 下 载 ， 请 求 被 优先 地 给 予 那些 即将 播放 的 块 ， 以 确保 连续 播放 |[ Dhungel 
2012} 

看 看 近期 已 经 向 混合 CDN-P2P 流 式 系统 迁移 [| Zhang 2015 ] 。 特 别 是 ， 看 看 目前 在 中 
国 部 署 了 数 以 百 计 的 服务 器 并 且 将 视频 内 容 推 同 这 些 服 务 句 。 这 个 看 看 CDN 在 流 式 视 频 
的 启动 阶段 起 着 主要 作用 。 在 大 多 数 场 合 ， 客 户 请 求 来 自 CDN IRS ANA AB IPL ABS, 
并 且 并 行 地 从 对 等 方 请 求 内 容 。 当 P2P 总 流量 满足 视频 播放 时 ， 该 客户 将 从 CDN 停止 流 
并 仅 从 对 等 方 获得 流 。 但 如 果 PP 流 的 流量 不 充分 ， 该 客户 重新 启动 CDN 连接 并 且 返 回 
到 混合 CDN-P2P 流 模 式 。 以 这 种 方式 ， 看 看 能 够 确保 短 启 动 时 延 ， 与 此 同时 最 小 地 依赖 
成 本 高 的 基础 设施 服务 器 和 带宽 。 


2.7 套 接 字 编程 : 生成 网 络 应 用 


我 们 已 经 看 到 了 一 些 重 要 的 网 络 应 用 ， 下 面 探讨 一 下 网 络 应 用 程序 是 如 何 实际 编写 
的 。 在 2. 1 节 讲 过 ， 典 型 的 网 络 应 用 是 由 一 对 程序 ( 即 客户 程序 和 服务 器 程序 ) 组 成 的 ， 
它们 位 于 两 个 不 同 的 端 系统 中 。 当 运行 这 两 个 程序 时 ， 创 建 了 一 个 客户 进程 和 一 个 服务 器 
进程 ， 同 时 它们 通过 从 套 接 字 读 出 和 写 人 数据 在 彼此 之 间 进 行 通 信 。 开 发 者 创建 一 个 网 络 
应 用 时 ， 其 主要 任务 就 是 编写 客户 程序 和 服务 器 程序 的 代码 。 

网 络 应 用 程序 有 两 类 。 一 类 是 由 协议 标准 (如 一 个 RFC 或 某 种 其 他 标准 文档 ) 中 所 
定义 的 操作 的 实现 ; 这 样 的 应 用 程序 有 时 称 为 “开放 ”的 ， 因 为 定义 其 操作 的 这 些 规则 为 
人 们 所 共 知 。 对 于 这 样 的 实现 ， 客 户 程序 和 服务 器 程序 必须 遵守 由 该 RFC 所 规定 的 规则 。 
例如 ， 某 客户 程序 可 能 是 HTTP 协议 客户 端的 一 种 实现 ， 如 在 2.2 节 所 描述 ， 该 协议 由 
RFC 2616 明确 定义 ; 类 似 地 ， 其 服务 器 程序 能 够 是 HTTP 服务 器 协议 的 一 种 实现 ， 也 由 
RFC 2616 明确 定义 。 如 果 一 个 开发 者 编写 客户 程序 的 代码 ， 另 一 个 开发 者 编写 服务 器 程 


序 的 代码 ， 并 且 两 者 都 完全 遵从 该 RFC 的 各 种 规则 ， 那 么 这 两 个 程序 将 能 够 交互 操作 。 
实际 上 ， 今 天 许多 网 络 应 用 程序 涉及 客户 和 服务 顺 程 序 间 的 通信 ， 这 些 程序 都 是 由 独立 的 
程序 员 开 发 的 。 例 如 ， 谷 歌 Chrome 浏览 器 与 Apache Web 服务 器 通信 ，BitTorrent 客户 与 
BitTorrent 跟踪 器 通信 。 

另 一 类 网 络 应 用 程序 是 专用 的 网 络 应 用 程序 。 在 这 种 情况 下 ， 由 客户 和 服务 器 程序 应 
用 的 应 用 层 协议 没有 公开 发 布 在 某 RFC 中 或 其 他 地 方 。 某 单独 的 开发 者 〈 或 开发 团队 ) 
产生 了 客户 和 服务 需 程 序 ， 并 且 该 开发 者 用 他 的 代码 完全 控制 该 代码 的 功能 。 但 是 因为 这 
些 代码 并 没有 实现 一 个 开放 的 协议 ， 其 他 独立 的 开发 者 将 不 能 开发 出 和 该 应 用 程序 交互 的 
代码 。 

在 本 节 中 ， 我 们 将 考察 研发 一 个 客户 -服务 器 应 用 程序 中 的 关键 问题 ， 我 们 将 “ 亲 
力 亲 为 ”来 实现 一 个 非常 简单 的 客户 -服务 器 应 用 程序 代码 。 在 研发 阶段 ， 开 发 者 必须 
最 先 做 的 一 个 决定 是 ， 应 用 程序 是 运行 在 TCP 上 还 是 运行 在 UDP 上 。 前 面 讲 过 TCP 是 
面向 连接 的 ， 并 且 为 两 个 端 系 统 之 间 的 数据 流动 提供 可 靠 的 字 节 流通 道 。UDP 是 无 连接 
的 ， 从 一 个 端 系统 癌 另 一 个 端 系 统 发 送 独 立 的 数据 分 组 ， 不 对 交付 提供 任何 保证 。 前 面 
也 讲 过 当 客 户 或 服务 器 程序 实现 了 一 个 由 某 RFC 定义 的 协议 时 ， 它 应 当 使 用 与 该 协议 
关联 的 周知 端口 号 ; 与 之 相反 ， 当 研发 一 个 专用 应 用 程序 时 ， 研 发 者 必须 注意 避免 使 用 
这 些 周 知 端口 号 。 (端口 号 已 在 2.1 节 简要 讨论 过 。 它 们 将 在 第 3 章 中 更 为 详细 地 
涉及 。) 

我 们 通过 一 个 简单 的 UDP 应 用 程序 和 一 个 简单 的 TCP 应 用 程序 来 介绍 UDP 和 TCP 套 
接 字 编 程 。 我 们 用 Python 3 来 呈现 这 些 简单 的 TCP 和 UDP 程序。 he Java, C 或 
C ++ 来 编写 这 些 程序 ， 而 我 们 选择 用 Python 最 主要 原因 是 Python 清楚 地 揭示 了 关键 的 套 
接 字 概念 。 使 用 Python ， 代 码 的 行 数 更 少 ， 并 且 加 新 编程 人 员 解 释 每 一 行 代 码 不 会 有 困 
难 。 如 果 你 不 熟悉 Python ， 也 用 不 着 担心 ， 只 要 你 有 过 一 些 用 Java, C C ++ 编程 的 经 
验 ， 就 应 该 很 容易 看 懂 下 面 的 代码 。 

”如 果 读 者 对 用 Java 进行 客户 - 服务 器 编程 感 兴趣 ， 建 议 你 去 查看 与 本 书 配套 的 Web 
网 站 。 事 实 上， 能 够 在 那里 找到 用 Java 编写 的 本 节 中 的 所 有 例子 (和 相关 的 实验 ) 。 如 
果 读 者 对 用 C 进行 客户 -服务 器 编程 感 兴趣 ， 有 一 些 优 秀 参考 资料 可 供 使 用 [ Donahoo 
2001; Stevens 1997; Frost 1994; Kurose 1996 |] 。 我 们 下 面 的 Python 例子 具有 类 似 于 C 
的 外 观 和 感觉 。 


2.7.1 UDP 套 接 字 编 程 


在 本 小 节 中 ， 我 们 将 编写 使 用 UDP 的 简单 客户 - 服务 器 程序 ; 在 下 一 小 节 中 ， 我 们 
将 编写 使 用 TCP 的 简单 程序 。 

2.1 节 讲 过 ， 运 行 在 不 同 机 器 上 的 进程 彼此 通过 向 套 接 字 发 送 报 文 来 进行 通信 。 我 们 
说 过 每 个 进程 好 比 是 一 座 房子 ， 该 进程 的 套 接 字 则 好 比 是 一 扇 门 。 应 用 程序 位 于 房子 中 门 
的 一 侧 ; 运输 层 位 于 该 门 朝 外 的 为 一 侧 。 应 用 程序 开发 者 在 套 接 字 的 应 用 层 一 侧 可 以 控制 
所 有 东西 ; 然而 ， 它 几乎 无 法 控制 运输 层 一 侧 。 

现在 我 们 仔细 观察 使 用 UDP 套 接 字 的 两 个 通信 进程 之 间 的 交互 。 在 发 送 进程 能 够 将 
数据 分 组 推出 套 接 字 之 门 之 前 ， 当 使 用 UDP 时 ， 必 须 先 将 目的 地 址 附 在 该 分 组 之 上 。 在 
该 分 组 传 过 发 送 方 的 套 接 字 之 后 ， 因 特 网 将 使 用 该 目的 地 址 通过 因特网 为 该 分 组 选 路 到 接 
收 进程 的 套 接 字 。 当 分 组 到 达 接 收 套 接 字 时 ， 接 收 进程 将 通过 该 套 接 字 取 回 分 组 ， 然 后 检 
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查分 组 的 内 容 并 采取 适当 的 动作 。 

因此 你 可 能 现在 想 知道 ， 附 在 分 组 上 的 目的 地 址 包含 了 什么 ? 如 你 所 期 待 的 那样 ， 目 
的 主机 的 IP 地 址 是 目的 地 址 的 一 部 分 。 通 过 在 分 组 中 包括 目的 地 的 IP 地址 ， 因 特 网 中 的 
路 由 器 将 能 够 通过 因特网 将 分 组 选 路 到 目的 主机 。 但 是 因为 一 台 主 机 可 能 运行 许多 网 络 应 
用 进程 ， 每 个 进程 具有 一 个 或 多 个 套 接 字 ， 所 以 在 目的 主机 指定 特定 的 套 接 字 也 是 必要 
的 。 当 生成 一 个 套 接 字 时 ， 就 为 它 分 配 一 个 称 为 端口 号 (port number) 的 标识 符 。 因 此 ， 
如 你 所 期 待 的 ， 分 组 的 目的 地 址 也 包括 该 套 接 字 的 端口 号 。 总 的 来 说 ， 发 送 进程 为 分 组 附 
上 目的 地 址 ， 该 目的 地 址 是 由 目的 主机 的 IP 地 址 和 目的 地 套 接 字 的 端口 号 组 成 的 。 此 外 ， 
如 我 们 很 快 将 看 到 的 那样 ， 发 送 方 的 源 地 址 也 是 由 源 主 机 的 IP 地 址 和 源 套 接 字 的 端口 号 
组 成 ， 该 源 地 址 也 要 附 在 分 组 之 上 。 然 而， 将 源 地 址 附 在 分 组 之 上 通常 并 不 是 由 UDP 应 
用 程序 代码 所 为 ， 而 是 由 底层 操作 系统 自动 完成 的 。 

我 们 将 使 用 下 列 简单 的 客户 -服务 器 应 用 程序 来 演示 对 于 UDP 和 TCP 的 套 接 字 编程 : 

1) 客户 从 其 键盘 读 取 一 行 字符 〈 数 据 ) 并 将 该 数据 向 服务 器 发 送 。 

2) 服务 器 接收 该 数据 并 将 这 些 字符 转换 为 大 写 。 

3) 服务 器 将 修改 的 数据 发 送 给 客户 。 

4) 客户 接收 修改 的 数据 并 在 其 监视 器 上 将 该 行 显示 出 来 。 

图 2-26 着 重 显示 了 客户 和 服务 器 的 主要 与 套 接 字 相关 的 活动 ， 两 者 通过 UDP 运输 服 
务 进行 通信 。 


服务 器 
( free pol ) 客户 
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图 2-26 使 用 UDP 的 客户 -服务 器 应 用 程序 


现在 我 们 自己 动手 来 查看 用 UDP 实现 这 个 简单 应 用 程序 的 一 对 客户 - 服务 器 程序 。 
我 们 在 每 个 程序 后 也 提供 一 个 详细 、 逐 行 的 分 析 。 我 们 将 以 UDP 客户 开始 ， 该 程序 将 向 
服务 器 发 送 一 个 简单 的 应 用 级 报 文 。 服 务 器 为 了 能 够 接收 并 回答 该 客户 的 报 文 ， 它 必须 准 
备 好 并 已 经 在 运行 ， 这 就 是 说 ， 在 客户 发 送 其 报 文 之 前 ， 服 务 器 必须 作为 一 个 进程 正在 
运行 。 


客户 程序 被 称 为 UDPClient. py， 服 务 器 程序 被 称 为 UDPServer. py。 为 了 强调 关键 问 
题 ， 我 们 有 意 提 供 最 少 的 代码 。“ 好 代码 ”无 疑 将 具有 更 多 辅助 性 的 代码 行 ， 特 别 是 用 
于 处 理 出 现 差 错 的 情况 。 对 于 本 应 用 程序 ， 我 们 任意 选择 了 12000 作为 服务 器 的 端 
口号 。 

1. UDPClient. py 

下 面 是 该 应 用 程序 客户 端的 代码 : 


from socket import * 

serverName = ‘hostname!’ 

serverPort = 12000 

clientSocket = socket(AF_INET, SOCK_DGRAM) 

message = raw_input(’Input lowercase sentence:’ ) 
clientSocket.sendto (message.encode(), (serverName, serverPort) ) 
modifiedMessage, serverAddress = clientSocket.recvfrom (2048) 
print (modifiedMessage. decode () ) 

clientSocket.close() 


现在 我 们 看 在 UDPClient. py 中 的 各 行 代码 。 


from socket import * 


该 socket 模块 形成 了 在 Python 中 所 有 网 络 通信 的 基础 。 包 括 了 这 行 ， 我 们 将 能 够 在 程 
序 中 创建 套 接 字 。 


serverName = ‘hostname’ 
serverPort = 12000 


第 一 行将 变量 serverName 置 为 字符 串 “hostname"”。 这 里 ， 我 们 提供 了 或 者 包含 服务 
需 的 了 下地 址 (如 “128. 138. 32. 126”) 或 者 包含 服务 器 的 主机 名 (如 “cis. poly. edu”) 的 
字符 串 。 如 果 我 们 使 用 主机 名 ， 则 将 自动 执行 DNS lookup 从 而 得 到 IP 地 址 。 第 二 行将 整 
AAS serverPort 置 为 12000 。 


clientSocket = socket (AF_INET, SOCK_DGRAM) 


ATE TRAP ERS, MH clientSocket, B—-TBRMIG AN SHH; 特别 是 ， 
AF_INET 指示 了 底层 网 络 使 用 了 IPv4。 (此 时 不 必 担 心 ， 我们 将 在 第 4 章 中 讨论 IPv4。) 
第 二 个 参数 指示 了 该 套 接 字 是 SOCK_DGRAM 类 型 的 ， 这 意味 着 它 是 一 个 UDP ERF (而 
不 是 一 个 TCP 套 接 字 ) 。 值 得 注意 的 是 ， 当 创建 套 接 字 时 ， 我 们 并 没有 指定 客户 套 接 字 的 
端口 号 ; 相反 ， 我 们 让 操作 系统 为 我 们 做 这 件 事 。 既 然 已 经 创建 了 客户 进程 的 门 ， 我 们 将 
要 生成 通过 该 门 发 送 的 报 文 。 


message = raw_input(’Input lowercase sentence:’ ) 


raw_input() 是 Python 中 的 内 置 功 能 。 当 执行 这 条 命令 时 ， 客 户 上 的 用 户 将 以 单词 
“Input lowercase sentence: ”进行 提示 ， 用 户 则 使 用 她 的 键盘 输入 一 行 ， 该 内 容 被 放 和 人 变量 
message 中 。 既 然 我 们 有 了 一 个 套 接 字 和 一 条 报 文 ， 我 们 将 要 通过 该 套 接 字 回 目 的 主机 发 
送 报 文 。 

clientSocket.sendto (message.encode(), (serverName, serverPort) ) 

在 上 述 这 行 中 ， 我们 首先 将 报 文 由 字符 串 类 型 转换 为 字 节 类 型 ， 因 为 我 们 需要 问 套 
接 字 中 发 送 字 节 ; 这 将 使 用 encode() 方 法 完成 。 方 法 sendto() 为 报 文 附 上 目的 地 址 
(serverName, serverPort) 并 且 回 进程 的 套 接 字 clientSocket 发 送 结 果 分 组 。 (如 前 面 所 
述 ， 源 地 址 也 附 到 分 组 上 上， 尽管 这 是 自动 完成 的 ， 而 不 是 显 式 地 由 代码 完成 的 。) 经 一 
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个 UDP 套 接 字 发 送 一 个 客户 到 服务 顺 的 报 文 非常 简单 ! 在 发 送 分 组 之 后 ， 客 户 等 待 接 
WOK ARS Ai AY ITE o 


modifiedMessage, serverAddress = clientSocket.recvfrom(2048) 


对 于 上 述 这 行 ， 当 一 个 来 自 因特网 的 分 组 到 达 该 客户 套 接 字 时 ， 该 分 组 的 数据 被 放 
置 到 变量 modifiedMessage 中 ， 其 源 地 址 被 放置 到 变量 serverAddress 中 。 变 量 serverAd- 
dress 包含 了 服务 器 的 IP 地 址 和 服务 器 的 端口 号 。 程 序 UDPClient 实际 上 并 不 需要 服务 器 
的 地 址 信息 ， 因 为 它 从 起 始 就 已 经 知道 了 该 服务 器 地 址 ; 而 这 行 Python 代码 仍然 提供 了 
AR ah AY Het. FFE recvfrom 也 取 缓 存 长 度 2048 作为 输入 。 (该 缓存 长 度 用 于 多 种 
目的 。) 


print (modifiedMessage.decode()) 


这 行将 报 文 从 字 节 转化 为 字符 串 后 ， 在 用 户 显 示 器 上 打印 出 modifiedMessage。 它 应 当 
是 用 户 键 入 的 原始 行 ， 但 现在 变 为 大 写 的 了 。 


clientSocket.close() 


该 行 关闭 了 套 接 字 。 然 后 关闭 了 该 进程 。 
2. UDPServer. py 


现在 来 看 看 这 个 应 用 程序 的 服务 句 羡 : 


from socket import * 

serverPort = 12000 

serverSocket = socket(AF_INET, SOCK_DGRAM) 
serverSocket.bind((’’, serverPort) ) 
print(”’The server is ready to receive”) 
while True: 


message, clientAddress = serverSocket.recvfrom(2048) 
modifiedMessage = message.decode() .upper () 
serverSocket.sendto (modifiedMessage.encode(), clientAddress) 


注意 到 UDPServer 的 开始 部 分 与 UDPClient 类 似 。 它 也 是 导入 套 接 字 模块 ， 也 将 整数 
变量 serverPort 设置 为 12000， 并 且 也 创建 套 接 字 类 型 SOCK_DGRAM (一 种 UDP ERF). 
与 UDPClient 有 很 大 不 同 的 第 一 行 代码 是 : 


serverSocket.bind((’’, serverPort) ) 


上 面 行将 端口 号 12000 与 该 服务 器 的 套 接 字 绑 定 〈 即 分 配 ) 在 一 起 。 因 此 在 UDPServ- 
er 中 ，( 由 应 用 程序 开发 者 编写 的 ) 代码 显 式 地 为 该 套 接 字 分 配 一 个 端口 号 。 以 这 种 方式 ， 
当 任何 人 向 位 于 该 服务 器 的 IP 地 址 的 端口 12000 发 送 一 个 分 组 ， 该 分 组 将 导向 该 套 接 字 。 
UDPServer 然后 进入 一 个 while 循环 ; 该 while 循环 将 允许 UDPServer 无 限期 地 接收 并 处 理 
来 自 客 户 的 分 组 。 在 该 while 循环 中 ，UDPServer 等 待 一 个 分 组 的 到 达 。 


message, clientAddress = serverSocket.recvfrom(2048) 


这 行 代 码 类 似 于 我 们 在 UDPClient 中 看 到 的 。 当 某 分 组 到 达 该 服务 器 的 套 接 字 时 ， 该 
分 组 的 数据 被 放置 到 变量 message 中 ， 其 源 地 址 被 放置 到 变量 clientAddress 中 。 变 量 clien- 
tAddress 包含 了 客户 的 IP 地址 和 客户 的 端口 号 。 这 里 ，UDPServer 将 利用 该 地 址 信息 ， 因 
为 它 提 供 了 返回 地 址 ， 类 似 于 普通 邮政 邮件 的 返回 地 址 。 使 用 该 源 地 址 信息 ， 服 务 器 此 时 
知道 了 它 应 当 将 回答 发 向 何 处 。 


modifiedMessage = message .decode () .upper () 


此 行 是 这 个 简单 应 用 程序 的 关键 部 分 。 它 在 将 报 文 转化 为 字符 串 后 ， 获 取 由 客户 发 送 
的 行 并 使 用 方法 upper() 将 其 转换 为 大 写 。 


serverSocket.sendto (modifiedMessage.encode(), clientAddress) 


最 后 一 行将 该 客户 的 地 址 (CIP 地 址 和 端口 号 ) 附 到 大 写 的 报 文 上 (在 将 字符 串 转化 
为 字 节 后 ) ， 并 将 所 得 的 分 组 发 送 到 服务 器 的 套 接 字 中 。( 如 前 面 所 述 ， 服 务 器 地 址 也 附 在 
分 组 上 ， 尽 管 这 是 自动 而 不 是 显 式 地 由 代码 完成 的 。) 然后 因特网 将 分 组 交付 到 该 客户 地 
址 。 在 服务 器 发 送 该 分 组 后 ， 它 仍 维持 在 while 循环 中 ， 等 待 (从 运行 在 任 一 台 主 机 上 的 
任何 客户 发 送 的 ) 另 一 个 UDP 分 组 到 达 。 

为 了 测试 这 对 程序 ， 可 在 一 台 主 机 上 运行 UDPClient. py， 并 在 另 一 台 主 机 上 运行 
UDPServer py。 保 证 在 UDPClient. py 中 包括 适当 的 服务 器 主机 名 或 耻 地 址 。 接 下 来 ， 在 
服务 器 主机 上 执行 编译 的 服务 器 程序 UDPServer. py。 这 在 服务 器 上 创建 了 一 个 进程 ， 等 
待 着 某 个 客户 与 之 联系 。 然 后 ， 在 客户 主机 上 执行 编译 的 客户 器 程序 UDPClient. py。 这 
在 客户 上 创建 了 一 个 进程 。 最 后 ， 在 客户 上 使 用 应 用 程序 ， 键 人 一 个 句子 并 以 回 车 
结束 。 

可 以 通过 稍 加 修改 上 述 客 户 和 服务 器 程序 来 研制 自己 的 UDP 客户 - 服务 器 程序 。 
例如 ， 不 必 将 所 有 字母 转换 为 大 写 ， 服 务 器 可 以 计算 字母 s 出 现 的 次 数 并 返回 该 数字 。 
或 者 能 够 修改 客户 程序 ， 使 其 在 收 到 一 个 大 写 的 句子 后 ， 用 户 能 够 向 服务 器 继续 发 送 更 
多 的 句子 。 


2.7.2 TCP 套 接 字 编程 


与 UDP 不 同 ，TCP 是 一 个 面向 连接 的 协议 。 这 意味 着 在 客户 和 服务 器 能 够 开始 互相 
发 送 数据 之 前 ， 它 们 先 要 握手 和 创建 一 个 TCP 连接 。TCP 连接 的 一 端 与 客户 套 接 字 相 联 
系 ， 另 一 端 与 服务 器 套 接 字 相 联系 。 当 创建 该 TCP 连接 时 ， 我 们 将 其 与 客户 套 接 字 地 址 
CIP 地 址 和 端口 号 ) 和 服务 器 套 接 字 地 址 (IP 地 址 和 端口 号 ) 关联 起 来 。 使 用 创建 的 TCP 
连接 ， 当 一 侧 要 向 另 一 侧 发 送 数据 时 ， 它 只 需 经 过 其 套 接 字 将 数据 丢 进 TCP 连接 。 这 与 
UDP Ala], UDP 服务 器 在 将 分 组 丢 进 套 接 字 之 前 必须 为 其 附 上 一 个 目的 地 地 址 。 

现在 我 们 仔细 观察 一 下 TCP 中 客户 程序 和 服务 器 程序 的 交互 。 客 户 具 有 向 服务 器 发 起 
接触 的 任务 。 服 务 器 为 了 能 够 对 客户 的 初始 接触 做 出 反应 ， 服 务 器 必须 已 经 准备 好 。 这 意 
味 着 两 件 事 。 第 一 ， 与 在 UDP 中 的 情况 一 样 ，TCP 服务 器 在 客户 试图 发 起 接触 前 必须 作 
为 进程 运行 起 来 。 第 二 ， 服 务 器 程序 必须 具有 一 扇 特 殊 的 门 ， 更 精确 地 说 是 一 个 特殊 的 套 
接 字 ， 该 门 欢迎 来 自 运行 在 任意 主机 上 的 客户 进程 的 某 种 初始 接触 。 使 用 房子 与 门 来 比喻 
进程 与 套 接 字 ， 有 时 我 们 将 客户 的 初始 接触 称 为 “ 敲 欢迎 之 门 ”。 

随 着 服务 器 进程 的 运行 ， 客 户 进程 能 够 向 服务 器 发 起 一 个 TCP 连接 。 这 是 由 客户 程序 
通过 创建 一 个 TCP 套 接 字 完成 的 。 当 该 客户 生成 其 TCP 套 接 字 时 ， 它 指定 了 服务 器 中 的 
欢迎 套 接 字 的 地 址 ， 即 服务 器 主机 的 IP 地 址 及 其 套 接 字 的 端口 号 。 生 成 其 套 接 字 后 ， 该 
客户 发 起 了 一 个 三 次 握手 并 创建 与 服务 器 的 一 个 TCP 连接 。 发 生 在 运输 层 的 三 次 握手 ， 对 
于 客户 和 服务 器 程序 是 完全 透明 的 。 

在 三 次 握手 期 间 ， 客 户 进 程 敲 服 务 器 进程 的 欢迎 之 门 。 当 该 服务 器 “ 听 ” 到 敲 门 声 
时 ， 它 将 生成 一 扇 新 门 (更 精确 地 讲 是 一 个 新 套 接 字 ) ， 它 专门 用 于 特定 的 客户 。 在 我 们 
下 面 的 例子 中 ， 欢 迎 之 门 是 一 个 我 们 称 为 serverSocket 的 TCP 套 接 字 对 象 ; 它 是 专门 对 客 
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户 进 行 连接 的 新 生成 的 套 接 字 ， 称 为 连接 套 接 字 (connectionSocket) 。 初 次 遇 到 TCP 套 接 
字 的 学 生 有 时 会 混 清 欢迎 套 接 字 ( 这 是 所 有 要 与 服务 器 通信 的 客户 的 起 始 接 触 点 ) 和 每 个 
新 生成 的 服务 器 侧 的 连接 套 接 字 〈 这 是 随后 为 与 每 个 客户 通信 而 生成 的 套 接 字 ) 。 


从 应 用 程序 的 观点 来 看 ， 客 户 套 接 
字 和 服务 器 连接 套 接 字 直 接 通过 一 根 管 
道 连接 。 如 图 2-27 所 示 ， 客 户 进 程 可 
以 向 它 的 套 接 字 发 送 任意 字 节 ， 并 且 
TCP 保证 服务 器 进程 能 够 按 发 送 的 顺序 
接收 (通过 连接 套 接 字 ) 每 个 字 节 。 
TCP 因此 在 客户 和 服务 器 进程 之 间 提 供 
了 可 靠 服务 。 此 外 ， 就 像 人 们 可 以 从 同 
一 扇 门 进 和 出 一 样 ， 客 户 进程 不 仅 能 向 
它 的 套 接 字 发 送 字 节 ， 也 能 从 中 接收 字 
节 ; 类 似 地 ， 服 务 器 进程 不 仅 从 它 的 连 
接 套 接 字 接收 字 节 ， 也 能 向 其 发 送 
字 节 。 

我 们 使 用 同样 简单 的 客户 - 服务 器 
应 用 程序 来 展示 TCP 套 接 字 编 程 : 客 
户 向 服务 器 发 送 一 行 数据 ， 服 务 器 将 这 





图 2-27 TCPServer 进程 有 两 个 套 接 字 


行 改 为 大 写 并 回 送 给 客户 。 图 2-28 着 重 显示 了 客户 和 服务 器 的 主要 与 套 接 字 相 关 的 活动 ， 


两 者 通过 TCP 运输 服务 进行 通信 。 
服务 器 
(在 serverIP 上 运行 ) 






Wl) | | [i i t jiy ™ i i Mia Te 
| | UW WET i Pi mi Wr We ET 
{ i | oc ker 

i ATTN il 
Whe 
HL 1 | 4 | iF E p 
i 小 be 


a ne P GH I | 
I TEA O er ee 
~ G ur ? wigi wi h ms z v 


me ea Re, 


N 


客户 





图 2-28 使 用 TCP 的 客户 -服务 器 应 用 程序 


1. TCPClient. py 
这 里 给 出 了 应 用 程序 客户 端的 代码 : 


from socket import * 

serverName = ‘’servername’ 

serverPort = 12000 

clientSocket = socket (AF_INET, SOCK_STREAM) 
clientSocket.connect((serverName,serverPort) ) 
sentence = raw_input(’Input lowercase sentence:’ ) 
clientSocket.send(sentence.encode() ) 
modifiedSentence = clientSocket.recv(1024) 
print(’From Server: ‘, modifiedSentence.decode () ) 
clientSocket.close() 


现在 我 们 查看 这 些 代 码 中 与 UDP 实现 有 很 大 差别 的 各 行 。 首 当 其 冲 的 行 是 客户 套 接 
字 的 创建 。 


clientSocket = socket(AF_INET, SOCK_STREAM) 


该 行 创 建 了 客户 的 套 接 字 ， 称 为 clientSocket。 第 一 个 参数 仍 指示 底层 网 络 使 用 的 是 
IPv4。 第 二 个 参数 指示 该 套 接 字 是 SOCK_STREAM 类 型 。 这 表明 它 是 一 个 TCP ERF (m 
不 是 一 个 UDP 套 接 字 ) 。 值 得 注意 的 是 当 我 们 创建 该 客户 套 接 字 时 仍 未 指定 其 端口 号 ; 相 
A, 我们 让 操作 系统 为 我 们 做 此 事 。 此 时 的 下 一 行 代码 与 我 们 在 UDPClient 中 看 到 的 极为 
不 同 : 


clientSocket.connectl( (serverName, serverPort)) 


前 面 讲 过 在 客户 能 够 使 用 一 个 TCP 套 接 字 疝 服务 器 发 送 数据 之 前 (反之 亦 然 ) ， 必 须 
在 客户 与 服务 器 之 间 创 建 一 个 TCP 连接 。 上 面 这 行 就 发 起 了 客户 和 服务 器 之 间 的 这 条 TCP 
连接 。connect() 方 法 的 参数 是 这 条 连接 中 服务 器 端的 地 址 。 这 行 代码 执行 完 后 ， 执 行 三 次 
握手 ， 并 在 客户 和 服务 器 之 间 创 建 起 一 条 TCP 连接 。 


sentence = raw_input(’Input lowercase sentence:’ ) 


如 同 UDPClient 一 样 ， 上 一 行 从 用 户 获得 了 一 个 句子 。 字 符 串 sentence 连续 收集 字符 
直到 用 户 键 入 回 车 以 终止 该 行为 止 。 代 码 的 下 一 行 也 与 UDPClient 极为 不 同 : 


clientSocket.send(sentence.encode() ) 


上 一 行 通 过 该 客户 的 套 接 字 并 进入 TCP 连接 发 送 字符 串 sentence。 值 得 注意 的 是 ， 该 
程序 并 未 显 式 地 创建 一 个 分 组 并 为 该 分 组 附 上 目的 地 址 ， 而 使 用 UDP 套 接 字 却 要 那样 做 。 
相反 ， 该 客户 程序 只 是 将 字符 串 sentence 中 的 字 节 放 入 该 TCP 连接 中 去 。 客 户 然后 就 等 待 
接收 来 自 服务 器 的 字 节 。 


modifiedSentence = clientSocket.recv (2048) 


当 字符 到 达 服 务 器 时 ， 它 们 被 放置 在 字符 串 modifiedSentence 中 。 字 符 继 续 积累 在 


modifiedSentence 中 ， 直 到 该 行 以 回 车 符 结束 为 止 。 在 打印 大 写 句 子 后 ， 我 们 关闭 客户 的 套 
接 字 。 


clientSocket.close() 


最 后 一 行 关 闭 了 套 接 字 ， 因 此 关闭 了 客户 和 服务 器 之 间 的 TCP 连接 。 它 引起 客户 中 的 
TCP 向 服务 器 中 的 TCP 发 送 一 条 TCP FRX (参见 3.5 节 )。 
2. TCPServer. py 


现在 我 们 看 一 下 服务 器 程序 。 
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from socket import * 

serverPort = 12000 

serverSocket = socket (AF_INET, SOCK_STREAM) 

serverSocket.bind((’’,serverPort) ) 

serverSocket.listen (1) 

print(’The server is ready to receive’) 

while True: 
connectionSocket, addr = serverSocket.accept () 
sentence = connectionSocket.recv (1024) .decode () 
capitalizedSentence = sentence.upper () 
connectionSocket.send (capitalizedSentence.encode () ) 
connectionSocket.close() 


现在 我 们 来 看 看 上 述 与 UDPServer 及 TCPClient 有 显著 不 同 的 代码 行 。 与 TCPClient 相 
同 的 是 ， 服 务 器 创建 一 个 TCP 套 接 字 ， 执 行 : 


serverSocket=socket (AF_INET, SOCK_STREAM) 


与 UDPServer 类 似 ， 我 们 将 服务 器 的 端口 号 serverPort 与 该 套 接 字 关联 起 来 : 


serverSocket.bind((’’,serverPort) ) 


但 对 TCP MA, serverSocket 将 是 我 们 的 欢迎 套 接 字 。 在 创建 这 扇 欢 迎 之 门 后 ， 我 们 
将 等 待 并 聆听 某 个 客户 敲 门 : 


serverSocket.listen (1) 


该 行 让 服务 器 聆听 来 自 客 户 的 TCP 连接 请 求 。 其 中 参数 定义 了 请 求 连接 的 最 大 数 
(至 少 为 1)。 


connectionSocket, addr = serverSocket.accept () 


当 客 户 敲 该 门 时 ， 程 序 为 serverSocket 调用 accept() 方 法 ， 这 在 服务 器 中 创建 了 一 个 称 
为 connectionSocket 的 新 套 接 字 ， 由 这 个 特定 的 客户 专用 。 客 户 和 服务 器 则 完成 了 握手 ， 在 
客户 的 clientSocket PARI AFH serverSocket 之 间 创 建 了 一 个 TCP 连接 。 借 助 于 创建 的 TCP 
连接 ， 客 户 与 服务 器 现在 能 够 通过 该 连接 相互 发 送 字 节 。 使 用 TCP， 从 一 侧 发 送 的 所 有 字 
节 不 仅 确保 到 达 另 一 侧 ， 而 且 确 保 按 序 到 达 。 


connectionSocket.close() 


在 此 程序 中 ， 在 回 客 户 发 送 修改 的 句子 后 ， 我 们 关闭 了 该 连接 套 接 字 。 但 由 于 server- 
Socket 保持 打开 ， 所 以 为 一 个 客户 此 时 能 够 敲 门 并 向 该 服务 右 发 送 一 个 句子 要 求 修改 。 

我 们 现在 完成 了 TCP 套 接 字 编 程 的 讨论 。 建 议 你 在 两 台 单独 的 主机 上 运行 这 两 个 程 
序 ， 也 可 以 修改 它们 以 达到 稍微 不 同 的 目的 。 你 应 当 将 前 面 两 个 UDP 程序 与 这 两 个 TCP 
程序 进行 比较 ， 观 察 它 们 的 不 同 之 处 。 你 也 应 当做 在 第 2、4 和 9 章 后 面 描述 的 套 接 字 编 
程 作业 。 最 后 ， 我 们 希望 在 掌握 了 这 些 和 更 先进 的 套 接 字 程 序 后 的 某 天 ， 你 将 能 够 编写 你 
自己 的 流行 网 络 应 用 程序 ， 变 得 非常 宣 有 和 声名 卓著 ， 并 记得 本 书 的 作者 ! 


2.8 小 结 


在 本 章 中 ， 我 们 学 习 了 网 络 应 用 的 概念 和 实现 两 个 方面 。 我 们 学 习 了 被 因特网 应 用 普 
饥 采 用 的 客户 -服务 器 模式 ， 并 且 看 到 了 该 模式 在 HTTP、SMTP、POP3 和 DNS 等 协议 中 
的 使 用 。 我 们 已 经 更 为 详细 地 学 习 了 这 些 重要 的 应 用 层 协议 以 及 与 之 对 应 的 相关 应 用 
(Web、 文 件 传输 、 电 子 邮 件 和 DNS)。 我 们 也 已 学习 了 P2P 体系 结构 以 及 它 如 何 应 用 在 许 
多 应 用 程序 中 。 我 们 也 学 习 了 流 式 视频 ， 以 及 现代 视频 分 发 系统 是 如 何 利用 CDN 的 。 对 
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于 面向 连接 的 〈TCP) 和 无 连接 的 (UDP) 端 到 端 传输 服务 ， 我 们 走马 观 花 般 地 学 习 了 和 套 
接 字 的 使 用 。 至 此 ， 我 们 在 分 层 的 网 络 体系 结构 中 的 向 下 之 旅 已 经 完成 了 第 一 步 。 

在 本 书 一 开始 的 1.1 节 中 ， 我 们 对 协议 给 出 了 一 个 相当 含糊 的 框架 性 定义 : “在 两 个 
或 多 个 通信 实体 之 间 交 换 报 文 的 格式 和 次 序 ， 以 及 对 某 报 文 或 其 他 事件 传输 和 /或 接收 所 
采取 的 动作 。” 本章 中 的 内 容 ， 特 别 是 我 们 对 HTTP, SMTP, POP3 和 DNS 协议 进行 的 细 
致 研究 ， 已 经 为 这 个 定义 加 入 了 相当 可 观 的 实质 性 的 内 容 。 协 议 是 网 络 连接 中 的 核心 概 
念 ; 对 应 用 层 协议 的 学 习 ， 为 我 们 提供 了 有 关 协 议 内 涵 的 更 为 直觉 的 认识 。 

在 2.1 P, RHE T TCP 和 UDP 为 调用 它们 的 应 用 提供 的 服务 模型 。 当 我 们 在 
2.7 节 中 开发 运行 在 TCP 和 UDP 之 上 的 简单 应 用 程序 时 ， 我 们 对 这 些 服务 模型 进行 了 更 加 
深入 的 观察 。 然 而 ， 我 们 几乎 没有 介绍 TCP 和 UDP 是 如 何 提供 这 种 服务 模型 的 。 例 如 ， 
我 们 知道 TCP 提供 了 一 种 可 靠 数据 服务 ， 但 我 们 未 说 它 是 如 何 做 到 这 一 点 的 。 在 下 一 章 中 
我 们 将 不 仅 关注 运输 协议 是 什么 ， 而 且 还 关注 它 如 何 工作 以 及 为 什么 要 这 么 做 。 

有 了 因特网 应 用 程序 结构 和 应 用 层 协议 的 知识 之 后 ， 我 们 现在 准备 继续 沿 该 协议 栈 向 
F, 在 第 3 章 中 探讨 运输 层 。 


课 后 习题 和 问题 


EA 复习 题 


2.175 

R1. 列 出 5 种 非 专用 的 因特网 应 用 及 它们 所 使 用 的 应 用 层 协 议 。 

R2. 网 络 体系 结构 与 应 用 程序 体系 结构 之 间 有 什么 区 别 ? 

R3. 对 两 进程 之 间 的 通信 会 话 而 言 ， 哪 个 进程 是 客户 ， 哪 个 进程 是 服务 器 ? 

R4. 对 一 个 P2P 文件 共享 应 用 ， 你 同意 “一 个 通信 会 话 不 存在 客户 端 和 服务 器 端的 概念 ”的 说 法 吗 ? 为 

> FPA? 

R5. 运行 在 一 台 主 机 上 的 一 个 进程 ， 使 用 什么 信息 来 标识 运行 在 另 一 台 主 机 上 的 进程 ? 

R6. 假定 你 想 尽 快 地 处 理 从 远程 客户 到 服务 器 的 事务 ， 你 将 使 用 UDP 还 是 TCP? 为 什么 ? 

R7. 参见 图 2-4， 我 们 看 到 在 该 图 中 所 列 出 的 应 用 程序 没有 一 个 同时 既 要 求 无 数据 丢失 又 要 求 定时 的 。 你 
能 设想 一 个 既 要 求 无 数据 丢失 又 高 度 时 间 敏 感 的 应 用 程序 吗 ? 

R8. 列 出 一 个 运输 协议 能 够 提供 的 4 种 宽泛 类 型 的 服务 。 对 于 每 种 服务 类 型 ， 指 出 是 UDP 还 是 TCP (或 
这 两 种 协议 ) 提供 这 样 的 服务 ? 

R9. 前 面 讲 过 TCP 能 用 SSL 来 强化 ， 以 提供 进程 到 进程 的 安全 性 服务 ， 包 括 加 密 。SSL 运行 在 运输 层 还 
是 应 用 层 ?” 如 果 某 应 用 程序 研制 者 想 要 用 SSL 来 强化 UDP， 该 研制 者 应 当做 些 什么 工作 ? 

2.2 ~2.4 节 

R10. 握手 协议 的 作用 是 什么 ? 

R11. 为 什么 HTTP, SMTP 及 POP3 都 运行 在 TCP， 而 不 是 UDP 上 ? 

R12. 考虑 一 个 电子 商务 网 站 需要 保留 每 一 个 客户 的 购买 记录 。 描 述 如 何 使 用 cookie 来 完成 该 功能 ? 

R13. 描述 Web 缓存 器 是 如 何 减少 接收 被 请 求 对 象 的 时 延 的 。Web 缓存 器 将 减少 一 个 用 户 请 求 的 所 有 对 
象 或 只 是 其 中 的 某 些 对 象 的 时 延 吗 ? 为 什么 ? 

R14. Telnet 到 一 台 Web 服务 器 并 发 送 一 个 多 行 的 请 求 报 文 。 在 该 请 求 报 文 中 包含 全 -modified - since; 首 
部 行 ， 迫 使 响应 报 文中 出 现 “304 Not Modified” 状态 代码 。 

R15. 列 出 几 种 流行 的 即时 通信 应 用 。 它 们 使 用 相同 的 协议 作为 SMS 吗 ? 

R16. 假定 Alice 使 用 一 个 基于 Web 的 电子 邮件 账户 (例如 Hotmail 或 Gmail) 向 Bob 发 报 文 ， 而 Bob 使 用 
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POP3 从 他 的 邮件 服务 器 访问 自己 的 邮件 。 讨 论 该 报 文 是 如 何 从 Alice 主机 到 Bob 主机 的 。 要 列 出 在 
两 台 主机 间 移 动 该 报 文 时 所 使 用 的 各 种 应 用 层 协 议 。 

R17. 将 你 最 近 收 到 的 报 文 首部 打印 出 来 。 其 中 有 和 多少 Received: 首部 行 ? 分 析 该 报 文 的 首部 行 中 的 每 
一 行 。 

R18. 从 用 户 的 观点 看 ，POP3 协议 中 下 载 并 删除 模式 和 下 载 并 保留 模式 有 什么 区 别 吗 ? 

R19. 一 个 机 构 的 Web 服务 器 和 邮件 服务 器 可 以 有 完全 相同 的 主机 名 别名 (例如 ，foo. com) 吗 ? 包含 邮 
件 服务 器 主机 名 的 RR 有 什么 样 的 类 型 ? 

R20. 仔细 检查 收 到 的 电子 邮件 ， 查 找 由 使 用 . edu 电子 邮件 地 址 的 用 户 发 送 的 报 文 首部 。 从 其 首部 ， 能 
够 确定 发 送 该 报 文 的 主机 的 IP 地 址 吗 ? 对 于 由 Gmail 账号 发 送 的 报 文 做 相同 的 事 。 

2. 5 节 

R21. 在 BitTorrent 中 ， 假 定 Alice 向 Bob 提供 一 个 30 秒 间 隔 的 文件 块 吞吐 量 。Bob 将 必须 进行 回报 ， 在 相 
同 的 间隔 中 向 Alice 提供 文件 块 吗 ? 为 什么 ? 

R22. 考虑 一 个 新 对 等 方 Alice 加 入 BitTorrent 而 不 拥有 任何 文件 块 。 没 有 任何 块 ， 因 此 她 没有 任何 东西 可 
上 载 ， 她 无 法 成 为 任何 其 他 对 等 方 的 前 4 位 上 载 者 。 那 么 Alice 将 怎样 得 到 她 的 第 一 个 文件 块 呢 ? 

R23. 覆盖 网 络 是 什么 ? 它 包 括 路 由 器 吗 ? 在 覆盖 网 络 中 边 是 什么 ? 

2. 6 节 

R24. CDN 通常 采用 两 种 不 同 的 服务 器 放置 方法 之 一 。 列 举 并 简单 描述 它们 。 

R25. 除了 如 时 延 、 丢 包 和 带宽 性 能 等 网 络 相 关 的 考虑 外 ， 设 计 一 种 CDN 服务 器 选择 策略 时 还 有 其 他 重 
要 因素 。 它 们 是 什么 ? 

2.7 节 

R26. 2.7 节 中 所 描述 的 UDP 服务 器 仅 需 要 一 个 套 接 字 ， 而 TCP 服务 器 需要 两 个 套 接 字 。 为 什么 ?如 果 
TCP 服务 器 支持 n 个 并 行 连接 ， 每 条 连接 来 自 不 同 的 客户 主机 ， 那 么 TCP 服务 器 将 需要 多 少 个 套 
接 字 ? 

R27. 对 于 2.7 节 所 描述 的 运行 在 TCP 之 上 的 客户 -服务 器 应 用 程序 ， 服 务 器 程序 为 什么 必须 先 于 客户 程序 


一 /一 


运行 ? 对 于 运行 在 UDP 之 上 的 客户 - 服务 器 应 用 程序 ， 客 户 程序 为 什么 可 以 先 于 服务 器 程序 运行 ? 


Z 习题 


P1. 是 非 判 断 题 。 
a. 假设 用 户 请 求 由 一 些 文本 和 3 幅 图 像 组 成 的 Web 页面。 对 于 这 个 页 面 ， 客 户 将 发 送 一 个 请 求 报 文 
并 接收 4 个 响应 报 文 。 
b. 两 个 不 同 的 Web 页 面 (例如 ，www. mit. edu/research. html 及 www. mit. edu/students. html) 可 以 通 
过 同一 个 持续 连接 发 送 。 
c. 在 浏览 器 和 初始 服务 器 之 间 使 用 非 持 续 连 接 的 话 ， 一 个 TCP 报 文 段 是 可 能 携带 两 个 不 同 的 HTTP 
服务 请 求 报 文 的 。 
d. 在 HTTP 响应 报 文中 的 Date: 首部 指出 了 该 响应 中 对 象 最 后 一 次 修改 的 时 间 。 
e. HTTP 响应 报 文 决 不 会 具有 空 的 报 文体 。 
P2. SMS, iMessage 和 WhatsApp 都 是 智能 手机 即时 通信 系统 。 在 因特网 上 进行 一 些 研究 后 ， 为 这 些 系统 
分 别 写 一段 它 们 所 使 用 协议 的 文字 。 然 后 撰文 解释 它们 的 差异 所 在 。 
P3. 考虑 一 个 要 获取 给 定 URL 的 Web 文档 的 HTTP 客户 。 该 HTTP 服务 器 的 IP 地 址 开始 时 并 不 知道 。 在 
这 种 情况 下 ， 除 了 HTTP 外 ， 还 需要 什么 运输 层 和 应 用 层 协议 ? 
考虑 当 浏 览 器 发 送 一 个 HTTP GET 报 文 时 ， 通 过 Wireshark 俘获 到 下 列 ASCI 字符 串 〈 即 这 是 一 
HTTP GET 报 文 的 实际 内 容 ) 。 字 符 <cr > <f> 是 回 车 和 换行 符 ( 即 下 面 文本 中 的 斜体 字符 串 cr > 
表示 了 单个 回 车 符 ， 该 回 车 符 包含 在 HTTP 首部 中 的 相应 位 置 )。 回 答 下 列 问题 ， 指 出 你 在 下 面 HT 
TP GET 报 文中 找到 答案 的 地 方 。 
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GET /cs453/index.html HTTP/1.1<cr><lf>Host: gai 
a.cs.umass.edu<cr><lf>User-Agent: Mozilla/5.0 ( 

Windows;U; Windows NT 5.1; en-US; rv:1.7.2) Gec 

ko/20040804 Netscape/7.2 (ax) <cr><lf>Accept:ex 

t/xml, application/xml, application/xhtml+xml, text 

/html;q=0.9, text/plain; q=0.8, image/png, */*;q=0.5 

<cr><lf>Accept-Language: en-us,en;q=0.5<cr><lf>Accept- 

Encoding: zip,deflate<cr><lf>Accept-Charset: ISO 
-8859-1,utf-8;q=0.7,*;q=0.7<cr><lf>Keep-Alive: 300<cr> 

<1f>Connection: keep-alive<cr><l1f><cr><lf> 

由 浏览 器 请 求 的 文档 的 URL 是 什么 ? 

该 浏览 器 运行 的 是 HTTP 的 何 种 版 本 ? 

. 该 浏览 器 请 求 的 是 一 条 非 持续 连接 还 是 一 条 持续 连接 ? 

d. 该 浏览 器 所 运行 的 主机 的 IP 地 址 是 什么 ? 

e. 发 起 该 报 文 的 浏览 器 的 类 型 是 什么 ? 在 一 个 HTTP 请 求 报 文中 ， 为 什么 需要 浏览 器 类 型 ? 
. 下 面 文本 中 显示 的 是 来 自 服务 器 的 回答 ， 以 响应 上 述 问题 中 HTTP GET 报 文 。 回 答 下 列 问 题 ， 指 出 
你 在 下 面 报 文中 找到 答案 的 地 方 。 


HTTP/1.1 200 OK<cr><lf>Date: Tue, 07 Mar 2008 

12:39:45GMT<cr><lf>Server: Apache/2.0.52 (Fedora) 

<cr><lf>Last-Modified: Sat, 10 Dec2005 18:27:46 

GMT<cr><lf>ETag: “526c3-£22-a88a4c80"<cr><lf>Accept- 

Ranges: bytes<cr><lf>Content-Length: 3874<cr><lf> 

Keep-Alive: timeout=max=100<cr><lf>Connection: 

Keep-Alive<cr><lf>Content-Type: text/html; charset= 

ISO-8859-1l<cr><1lf><cr><lf><!doctype html public ”- 

//w3c//dtd html 4.0transitional//en”><lf><html><lf> 

<head><lf> <meta http-equiv="Content-Type” 

content="text/html; charset=iso-8859-1"><lf> <meta 

name="GENERATOR” content="Mozilla/4.79 [en] (Windows NT 

5.0; U) Netscape]”><lf> <title>CMPSCI 453 / 591 / 

NTU-ST550ASpring 2005 homepage</title><lf></head><lf> 

<much more document text following here (not shown)> 

a. ARF ar He AP MDH REAA? 该 文档 提供 回答 是 什么 时 间 ? 

b. 该 文档 最 后 修改 是 什么 时 间 ? 

c. 文档 中 被 返回 的 字 节 有 多 少 ? 

d. 文档 被 返回 的 前 5 个 字 节 是 什么 ”该 服务 器 同意 一 条 持续 连接 吗 ? 

. 获取 HTTP/1. 1 规范 (RFC 2616) 。 回 答 下 面 问题 

a. 解释 在 客户 和 服务 器 之 间 用 于 指示 关闭 持续 连接 的 信 令 机 制 。 客 户 、 服 务 器 或 两 者 都 能 发 送信 令 
通知 连接 关闭 吗 ? 

b. HTTP 提供 了 什么 加 密 服 务 ? 

c. 一 个 客户 能 够 与 一 个 给 定 的 服务 器 打开 3 条 或 更 多 条 并 发 连接 吗 ? 

d 如 果 一 个 服务 天 或 一 个 客户 检测 到 连接 已 经 空闲 一 段 时 间 ， 该 服务 器 或 客户 可 以 关闭 两 者 之 间 的 
传输 连接 。 一 侧 开始 关闭 连接 而 另 一 侧 通过 该 连接 传输 数据 是 可 能 的 吗 ? 请 解释 。 

. 假定 你 在 浏览 器 中 点 击 一 条 超 链 接 获得 Web 页 面 。 相 关联 的 URL 的 IP 地 址 没有 缓存 在 本 地 主机 上 ， 

因此 必须 使 用 DNS lookup 以 获得 该 IP 地 址 。 如 果 主 机 从 DNS 得 到 IP 地 址 之 前 已 经 访问 了 nA DNS 

NRA at; 相继 产生 的 RTT 依次 为 RTT, 、…、RTT,。 进 一 步 假 定 与 链 路 相关 的 Web 页 面 只 包含 一 个 

对 象 ， 即 由 少量 的 HTML 文本 组 成 。 令 RIT, 表示 本 地 主机 和 包含 对 象 的 服务 器 之 间 的 RTT 值 。 假 定 

该 对 象 传输 时 间 为 零 ， 则 从 该 客户 点 击 该 超 链接 到 它 接 收 到 该 对 象 需要 多 长 时 间 ? 

. 参照 习题 P7 ， 假 定 在 同一 服务 器 上 某 HTML 文件 引用 了 8 个 非常 小 的 对 象 。 忽 略 发 送 时 间 ， 在 下 列 

情况 下 需要 多 长 时 间 : 

a. 没有 并 行 TCP 连接 的 非 持 续 HTTP. 
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b. 配置 有 5 个 并 行 连接 的 非 持 续 HTTP, 
c. 持续 HTTP, 

P9. 考虑 图 2-12， 其 中 有 一 个 机 构 的 网 络 和 因特网 相连 。 假 定 对 象 的 平均 长 度 为 8$0 000 比特 ， 从 这 个 机 
构 网 的 浏览 器 到 初始 服务 器 的 平均 请 求 率 是 每 秒 16 个 请 求 。 还 假定 从 接 人 链 路 的 因特网 一 侧 的 路 由 
器 转发 一 个 HTTP 请 求 开始 ， 到 接收 到 其 响应 的 平均 时 间 是 3 秒 (参见 2.2.5 节 )。 将 总 的 平均 响应 
时 间 建 模 为 平均 接 人 时 延 ( 即 从 因特网 路 由 器 到 机 构 路 由 器 的 时 延 ) 和 平均 因特网 时 延 之 和 。 对 于 
平均 接 人 时 延 ， 使 用 A/(1-AB), st A 是 跨越 接 和 人 链 路 发 送 一 个 对 象 的 平均 时 间 ,，B 是 对 象 对 该 
接 入 链 路 的 平均 到 达 率 。 
a. 求 出 总 的 平均 响应 时 间 。 
b. 现在 假定 在 这 个 机 构 LAN 中 安装 了 一 个 缓存 器 。 假 定 命中 率 为 0.4, 求 出 总 的 啊 应 时 间 。 

P10. 考虑 一 条 10 米 短 链 路 ， 某 发 送 方 经 过 它 能 够 以 150bps 速率 双向 传输 。 假 定 包 含 数据 的 分 组 是 
100 000 比 特长 ， 仅 包含 控制 (如 ACK REF) 的 分 组 是 200 比特 长 。 假 定 NN 个 并 行 连接 每 个 都 获 
得 1/N 的 链 路 带宽 。 现 在 考虑 HTTP 协议 ， 并 且 假 定 每 个 下 载 对 象 是 100Kb 长 ， 这 些 初始 下 载 对 象 
包含 10 个 来 自 相 同 发 送 方 的 引用 对 象 。 在 这 种 情况 下 ， 经 非 持续 HTTP 的 并 行 实例 的 并 行 下 载 有 意 
义 吗 ? 现在 考虑 持续 HTTP。 你 期 待 这 比 非 持 续 的 情况 有 很 大 增益 吗 ? 评价 并 解释 你 的 答案 。 

. 考虑 在 前 一 个 习题 中 引出 的 情况 。 现 在 假定 该 链 路 由 Bob 和 4 个 其 他 用 户 所 共享 。Bob 使 用 非 持 续 
HTTP 的 并 行 实例 ， 而 其 他 4 个 用 户 使 用 无 并 行 下 载 的 非 持续 HTTP, 

a. Bob 的 并 行 连接 能 够 帮助 他 更 快 地 得 到 Web 页 面 吗 ? 
b. 如 果 所 有 5 个 用 户 打开 5 个 非 持续 HTTP 并 行 实例 ， 那 么 Bob 的 并 行 连接 仍 将 是 有 好 处 的 吗 ? 为 什么 ? 
P12. 写 一 个 简单 的 TCP 程序 ， 使 服务 器 接收 来 自 客 户 的 行 并 将 其 打印 在 服务 器 的 标准 输出 上 。 (可 以 通 
过 修改 本 书 中 的 TCPServer py 程序 实现 上 述 任 务 。) 编译 并 执行 你 的 程序 。 在 另 一 台 有 浏览 器 的 机 
器 上 ， 设 置 浏览 器 的 代理 服务 器 为 你 正在 运行 服务 器 程序 的 机 器 ， 同 时 适当 地 配置 端口 号 。 这 时 你 
的 浏览 器 向 服务 器 发 送 GET 请 求 报 文 ， 你 的 服务 器 应 当 在 其 标准 输出 上 显示 该 报 文 。 使 用 这 个 平台 
来 确定 你 的 浏览 器 是 否 对 本 地 缓存 的 对 象 产生 了 条 件 GET RX., 

P13. SMTP 中 的 MAIL FROM 与 该 邮件 报 文 自身 中 的 From: 之 间 有 什么 不 同 ? 

P14. SMTP 是 怎样 标识 一 个 报 文体 结束 的 ? HTTP 是 怎样 做 的 呢 ? HTTP 能 够 使 用 与 SMTP 标识 一 个 报 文 
体 结束 相同 的 方法 吗 ” 试 解释 。 

P15. 阅读 用 于 SMTP 的 RFC 5321。MTA 代表 什么 ”考虑 下 面 收 到 的 垃圾 邮件 (从 一 份 真 实 垃 圾 邮件 修改 
得 到 ) 。 假 定 这 封 垃 圾 邮件 的 唯一 始作俑者 是 恶意 的 ， 而 其 他 主机 是 诚实 的 ， 指 出 产生 了 这 封 垃圾 
邮件 的 恶意 主机 。 


From - Fri Nov 07 13:41:30 2008 

Return-Path: <tennis5S@pp33head.com> 

Received: from barmail.cs.umass.edu (barmail.cs.umass. 
edu 

(128.119.240.3]) by cs.umass.edu (8.13.1/8.12.6) for 
<hg@cs.umass.edu>; Fri, 7 Nov 2008 13:27:10 -0500 
Received: from asusus-4b96 (localhost [127.0.0.1]) by 
barmail.cs.umass.edu (Spam Firewall) for <hg@cs.umass. 
edu>s; Fri, 7 

Nov 2008 13:27:07 -0500 (EST) 

Received: from asusus-4b96 ([58.88.21.177]) by barmail. 
cs.umass.edu 

for <hg@cs.umass.edu>; Fri, 07 Nov 2008 13:27:07 -0500 
(EST) 

Received: from [58.88.21.177] by inbnd55.exchangeddd. 
com; Sat, 8 

Nov 2008 01:27:07 +0700 

From: “Jonny” <tennis5@pp33head.com> 

To: <hg@cs.umass.edu> 
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Subject: How to secure your savings 


P16. 阅读 POP3 的 RFC, Bf) RFC 1939, UIDL POP3 命令 的 目的 是 什么 ? 
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P17. 考虑 用 POP3 访问 你 的 电子 邮件 。 


P18. 


P19. 


P20. 


P22. 
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a. 假定 你 已 经 配置 以 下 载 并 删除 模式 运行 的 POP 邮件 客户 。 完 成 下 列 事务 : 


list 
1 498 
2 912 


retr 1 
blah blah «.. 
ee ee ee blah 


ee Eo 


了 


. 假定 你 已 经 配置 以 下 载 并 保持 模式 运行 的 POP 邮件 客户 。 完 成 下 列 事务 : 


List 
1 498 
2. “912 


= 


retr 1 
bian Dilah so 
a ieee blah 


nn 


. 假定 你 已 经 配置 以 下 载 并 保持 模式 运行 的 POP 邮件 客户 。 使 用 (b) 中 的 记录 ,假定 你 检索 报 文 
1 和 2， 退 出 POP，5 分 钟 以 后 ， 你 再 访问 POP 以 检索 新 电子 邮件 。 假 定 在 这 5 分 钟 间隔 内 ， 没 
有 新 报 文 发 送 给 你 。 给 出 第 二 种 POP 会 话 的 记录 。 

如 题 : 

a. 什么 是 whois 数据 库 ? 

b. 使 用 因特网 上 的 各 种 whois 数据 库 ， 获 得 两 台 DNS 服务 器 的 名 字 。 指 出 你 使 用 的 是 哪个 whois 数据 库 。 

c. 你 本 地 机 器 上 使 用 nslookup 向 3 台 DNS 服务 器 发 送 DNS 查询 : 你 的 本 地 DNS 服务 器 和 两 台 你 在 

(b) 中 发 现 的 DNS 服务 器 。 尝 试 对 类 型 A、NS 和 MX 报告 进行 查询 。 总 结 你 的 发 现 。 
d. 使 用 nslookup 找 出 一 台 具 有 多 个 IP 地 址 的 Web 服务 器 。 你 所 在 的 机 构 (学 校 或 公司 ) 的 Web AR 
务 器 具有 多 个 IP 地 址 吗 ? 

e. 使 用 ARIN whois 数据 库 ， 确 定 你 所 在 大 学 使 用 的 P 地 址 范围 。 

f 描述 一 个 攻击 者 在 发 动 攻击 前 ， 能 够 怎样 利用 whois 数据 库 和 nslookup 工具 来 执行 对 一 个 机 构 的 侦察 。 

g 讨论 为 什么 whois 数据 库 应 当 为 公众 所 用 。 

在 本 习题 中 ， 我 们 使 用 在 Unix 和 Linux 主机 上 可 用 的 dig 工具 来 探索 DNS 服务 器 的 等 级 结构 。 

图 2-18 讲 过 ， 在 DNS 等 级 结构 中 较 高 的 DNS 服务 器 授权 对 该 等 级 结构 中 较 低 DNS 服务 器 的 DNS 请 

求 ， 这 是 通过 向 DNS 客户 发 送 回 那 台 较 低层 次 的 DNS 服务 器 的 名 字 来 实现 的 。 先 阅读 dig 的 帮助 

页 ， 再 回答 下 列 问题 。 

a. 从 一 台 根 DNS 服务 器 〈 从 根 服务 器 [a-mj].root- servernet 之 一 ) 开始 ， 通 过 使 用 dig 得 到 你 所 在 系 的 

Web 服务 器 的 IP 地 址 ， 发 起 一 系列 查询 。 显 示 回 答 你 的 查询 的 授权 链 中 的 DNS 服务 器 的 名 字 列 表 。 

b. 对 几 个 流行 Web 站 点 如 google. com, yahoo. com 或 amazon. com， 重 复 上 一 小 题 。 

假定 你 能 够 访问 所 在 系 的 本 地 DNS 服务 器 中 的 缓存 。 你 能 够 提出 一 种 方法 来 粗略 地 确定 在 你 所 在 系 

的 用 户 中 最 为 流行 的 Web 服务 器 (你 所 在 系 以 外 ) 吗 ? 解释 原因 。 


Q 


. 假设 你 所 在 系 具有 一 台 用 于 系 里 所 有 计算 机 的 本 地 DNS 服务 器 。 你 是 普通 用 户 〈 即 你 不 是 网 络 / 系 


统管 理 员 )。 你 能 够 确定 是 否 在 几 秒 前 从 你 系 里 的 一 台 计 算 机 可 能 访问 过 一 台 外 部 Web 站 点 吗 ? 解 
释 原 因 。 

考虑 向 入 个 对 等 方 分 发 =15Gb 的 一 个 文件 。 该 服务 器 具有 u, =30Mbps 的 上 载 速 率 ， 每 个 对 等 方 
具有 d, =2Mbps 的 下 载 速率 和 上 载 速 率 u。 对 于 N=10、100 和 1000 J} H. u =300kbps, 700kbps 和 
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P23. 


P24. 


P25. 


P26. 


P27. 


P28. 


P29. 


P30. 


P3 


— 


P32. 


E 


ZL 套 接 字 编 程 作业 


2Mbps, XIF N AI u 的 每 种 组 合 绘制 出 确定 最 小 分 发 时 间 的 图 表 。 需 要 分 别针 对 客户 -服务 器 分 发 

和 P2P 分 发 两 种 情况 制作 。 

考虑 使 用 一 种 客户 - 服务 器 体系 结构 向 NN 个 对 等 方 分 发 一 个 下 比特 的 文件 。 假 定 一 种 某 服务 器 能 够 

同时 向 多 个 对 等 方 传输 的 流体 模型 ， 只 要 组 合 速率 不 超过 w,， 则 以 不 同 的 速率 向 每 个 对 等 方 传输 。 

a. 假定 uAN<d,;,。 定 义 一 个 具有 NF/u, 分 发 时 间 的 分 发 方案 。 

b. 假定 wu,/N 宇 di,。 定 义 一 个 具有 F/dii, 分 发 时 间 的 分 发 方案 。 

c 得 出 最 小 分 发 时 间 通 常 是 由 max| NF/u,, F/d,,,| 所 决定 的 结论 。 

考虑 使 用 PP 体系 结构 向 N 个 用 户 分 发 下 比特 的 一 个 文件 。 假 定 一 种 流体 模型 。 为 了 简化 起 见 ， 假 

E di 很 大 ， 因 此 对 等 方 下 载 带 宽 不 会 成 为 瓶颈 。 

a. BÆ u, < (u, +u + +un)AN。 定 义 一 个 具有 Flu, 分 发 时 间 的 分 发 方案 。 

b. BÆ u, > (u, tu, +… +un)AN。 定 义 一 个 具有 NF/(u, tu, +… tun) 分 发 时 间 的 分 发 方案 。 

c. 得 出 最 小 分 发 时 间 通 常 是 由 max| F/u,, NF/(u, +u, + +uy)} 所 决定 的 结论 。 

考虑 在 一 个 有 VN 个 活路 对 等 方 的 覆盖 网 络 中 ， 每 对 对 等 方 有 一 条 活跃 的 TCP 连接 。 此 外 ,假定 该 

TCP 连接 通过 总 共 M 台 路 由 器 。 在 对 应 的 覆盖 网 络 中 ， 有 多少 节点 和 边 ? 

假定 Bob 加 入 BitTorent， 但 他 不 希望 向 任何 其 他 对 等 方 上 载 任 何 数 据 (因此 称 为 搭便 车 )。 

a. Bob 声称 他 能 够 收 到 由 该 社区 共享 的 某 文件 的 完整 副本 。Bob 所 言 是 可 能 的 吗 ? 为 什么 ? 

b. Bob 进一步 声称 他 还 能 够 更 为 有 效 地 进行 他 的 “搭便 车 ”， 方 法 是 利用 所 在 系 的 计算 机 实验 室 中 
的 多 台 计 算 机 (具有 不 同 的 全 地址 )。 他 怎样 才能 做 到 这 些 呢 ? 

考虑 一 个 具有 N 个 视频 版 本 (具有 N 个 不 同 的 速率 和 质量 ) 和 WN 个 音频 版 本 (具有 ON 个 不 同 的 速率 

和 质量 ) 的 DASH 系统 。 假 设 我 们 想 允 许 播放 者 在 任何 时 间 选 择 个 视频 版 本 入 个 音频 版 本 之 一 : 

a. 如 果 我 们 生成 音频 与 视频 混合 的 文件 ， 因 此 服务 器 在 任何 时 间 仅 发 送 一 个 媒体 流 ， 该 服务 器 将 需 
要 存储 多 少 个 文件 (每 个 文件 有 一 个 不 同 的 URL)? 

b. 如 果 该 服务 器 分 别 发 送 音 频 流 和 视频 流 并 且 与 客户 同步 这 些 流 ， 该 服务 器 将 需要 存储 多 少 个 文件 ? 

在 一 台 主 机 上 安装 编译 TCPClient 和 UDPClient Python 程序 ， 在 另 一 台 主 机 上 安装 编译 TCPServer 和 

UDPServer 程序 。 

a. 假设 你 在 运行 TCPServer 之 前 运行 TCPClient， 将 发 生 什 么 现象 ”为 什么 ? 

b. 假设 你 在 运行 UDPServer 之 前 运行 UDPClient， 将 发 生 什么 现象 ”为 什么 ? 

ce 如果 你 对 客户 端 和 服务 器 端 使 用 了 不 同 的 端口 ， 将 发 生 什么 现象 ? 

假定 在 UDPClient. py 中 在 创建 套 接 字 后 增加 了 下 面 一 行 : 


clientSocket.bind((’’, 5432)) 


有 必要 修改 UDPServer. py 吗 ? UDPClient 和 UDPServer 中 的 套 接 字 端口 号 是 多 少 ? 在 变化 之 前 它们 是 
多 少 ? 

你 能 够 配置 浏览 器 以 打开 对 某 Web 站 点 的 多 个 并 行 连接 吗 ? 有 大 量 的 并 行 TCP 连接 的 优点 和 缺点 
是 什么 ? 


. 我 们 已 经 看 到 因特网 TCP 套 接 字 将 数据 处 理 为 字 节 流 ， 而 UDP 套 接 字 识别 报 文 边界 。 面 向 字 廊 API 


与 显 式 识别 和 维护 应 用 程序 定义 的 报 文 边 界 的 API 相 比 ， 试 给 出 一 个 优点 和 一 个 缺点 。 
什么 是 Apache Web 服务 器 ? 它 值 多 少 钱 ? 它 当前 有 多 少 功能 ? 为 回答 这 个 问题 ， 你 也 许 要 看 一 下 
维基 百科 。 


配套 Web 网 站 包括 了 6 个 套 接 字 编 程 作 业 。 前 四 个 作业 简 述 如 下 。 第 5 个 作业 利用 了 ICMP 协议 ， 


在 第 5 章 结尾 简 述 。 第 6 个 作业 使 用 了 多 媒体 协议 ， 在 第 9 章 结尾 进行 总 结 。 极 力 推荐 学 生 完 成 这 些 作 
业 中 的 几 个 〈 如 果 不 是 全 部 的 话 ) 。 学 生 能 够 在 Web 网 站 http://www. pearsonhighered. com/cs- resources 上 
找到 这 些 作 业 的 全 面 细节 ， 以 及 Python 代码 的 重要 片段 。 


作业 1: Web 服务 器 

在 这 个 编程 作业 中 ， 你 将 用 Python 语言 开发 一 个 简单 的 Web 服务 器 ， 它 仅 能 处 理 一 个 请 求 。 具 体 而 
， 你 的 Web 服务 器 将 : (1) 当 一 个 客户 (浏览 器 ) 联系 时 创建 一 个 连接 套 接 字 ; (2) 从 这 个 连接 接收 
HTTP 请 求 ; (3) 解释 该 请 求 以 确定 所 请 求 的 特定 文件 ; (4) 从 服务 器 的 文件 系统 获得 请 求 的 文件 ; 
(5) 创建 一 个 由 请 求 的 文件 组 成 的 HTTP 响应 报 文 ， 报 文 前 面 有 首部 行 ，(6) 经 TCP 连接 向 请 求 的 浏览 器 发 
送 响应 。 如 果 浏 览 器 请 求 一 个 在 该 服务 器 中 不 存在 的 文件 ， 服 务 器 应 当 返 回 一 个 “404 Not Found” 差错 报 文 。 

在 配套 网 站 中 ， 我 们 提供 了 用 于 该 服务 器 的 框架 代码 。 你 的 任务 是 完善 该 代码 ， 运 行 你 的 服务 器 ， 
通过 在 不 同 主机 上 运行 的 浏览 器 发 送 请 求 来 测试 该 服务 器 。 如 果 运 行 你 服务 器 的 主机 上 已 经 有 一 个 Web 
服务 器 在 运行 ， 你 应 当 为 该 Web 服务 器 使 用 一 个 不 同 于 80 端口 的 其 他 端口 。 

作业 2: UDP ping 程序 

在 这 个 编程 作业 中 ， 你 将 用 Python 编写 一 个 客户 ping 程序 。 该 客户 将 发 送 一 个 简单 的 ping 报 文 ， 接 
收 一 个 从 服务 器 返回 的 对 应 pong 报 文 ， 并 确定 从 该 客户 发 送 ping 报 文 到 接收 到 pong 报 文 为 止 的 时 延 。 
该 时 延 称 为 往返 时 延 (RTT) 。 由 该 客户 和 服务 器 提供 的 功能 类 似 于 在 现代 操作 系统 中 可 用 的 标准 ping 程 
序 。 然 而 ， 标 准 的 ping 使 用 互联 网 控制 报 文 协议 (ICMP) (我 们 将 在 第 5 章 中 学 习 ICMP)。 此 时 我 们 将 
创建 一 个 非 标准 (但 简单 ) 的 基于 UDP 的 ping 程序 。 

你 的 ping 程序 经 UDP 向 目标 服务 器 发 送 10 个 ping 报 文 。 对 于 每 个 报 文 ， 当 对 应 的 pong 报 文 返回 
时 ， 你 的 客户 要 确定 和 打印 RIT, AA UDP 是 一 个 不 可 靠 的 协议 ， 由 客户 发 送 的 分 组 可 能 会 丢失 。 为 
此 ， 客 户 不 能 无 限期 地 等 待 对 ping 报 文 的 回答 。 客 户 等 待 服务 器 回答 的 时 间 至 多 为 1 秒 ; 如 果 没 有 收 到 
回答 ， 客 户 假定 该 分 组 丢失 并 相应 地 打印 一 条 报 文 。 

在 此 作业 中 ， 你 将 给 出 服务 器 的 完整 代码 (在 配套 网 站 中 可 找到 )。 你 的 任务 是 编写 客户 代码 ， 该 
代码 与 服务 器 代码 非常 类 似 。 建 议 你 先 仔细 学 习 服 务 器 的 代码 ， 然 后 编写 你 的 客户 代码 ， 可 以 随意 地 从 
服务 器 代码 中 剪贴 代码 行 。 

作业 3: 邮件 客户 

这 个 编程 作业 的 目的 是 创建 一 个 向 任何 接收 方 发 送 电子 邮件 的 简单 邮件 客户 。 你 的 客户 将 必须 与 邮件 
服务 器 ( 如 谷歌 的 电子 邮件 服务 器 ) 创建 一 个 TCP 连接 ， 使 用 SMTP 协议 与 邮件 服务 器 进行 交谈 ， 经 该 邮 
件 服 务 器 向 某 接 收 方 〈 如 你 的 朋友 ) 发 送 一 个 电子 邮件 报 文 ， 最 后 关闭 与 该 邮件 服务 器 的 TCP 连接 。 

对 本 作业 ， 配 套 Web 站 点 为 你 的 客户 提供 了 框架 代码 。 你 的 任务 是 完善 该 代码 并 通过 向 不 同 的 用 户 
账户 发 送 电子 邮件 来 测试 你 的 客户 。 你 也 可 以 尝试 通过 不 同 的 服务 器 〈 例 如 谷歌 的 邮件 服务 器 和 你 所 在 
大 学 的 邮件 服务 器 ) 进行 发 送 。 

作业 4: 多 线程 Web 代理 服务 器 

在 这 个 编程 作业 中 ， 你 将 研发 一 个 简单 的 Web 代理 服务 器 。 当 你 的 代理 服务 器 从 一 个 浏览 器 接收 到 
对 某 对 象 的 HTTP 请 求 ， 它 生成 对 相同 对 象 的 一 个 新 HTTP 请 求 并 向 初始 服务 器 发 送 。 当 该 代理 从 初始 服 
务 器 接收 到 具有 该 对 象 的 HTTP 响应 时 ， 它 生成 一 个 包括 该 对 象 的 新 HTTP 啊 应 ， 并 发 送 给 该 客户 。 这 个 
代理 将 是 多 线程 的 ， 使 其 在 相同 时 间 能 够 处 理 多 个 请 求 。 

对 本 作业 而 言 ， 配 套 Web 网 站 对 该 代理 服务 器 提供 了 框架 代码 。 你 的 任务 是 完善 该 代码 ， 然 后 测试 
你 的 代理 ， 方 法 是 让 不 同 的 浏览 器 经 过 你 的 代理 来 请 求 Web 对 象 。 


| Wireshark 实验 : HTTP 


在 实验 1 中 ,我 们 已 经 初步 使 用 了 Wireshark 分 组 嗅 探 器 ， 现 在 准备 使 用 Wireshark 来 研究 运行 中 的 
协议 。 在 本 实验 中 ， 我们 将 研究 HTTP 协议 的 几 个 方面 : 基本 的 GET/ 回 答 交 互 ，HTTP 报 文 格式 ， 检 索 
KHTML Xft, MARA AK URL 的 HTML 文件 ， 持 续 和 非 持续 连接 ，HTTP 鉴别 和 安全 性 。 

如 同 所 有 的 Wireshark 实验 一 样 ， 对 该 实验 的 全 面 描述 可 查阅 本 书 的 Web 站 点 http://www. pearson- 


highered. com/cs- resources。 
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制 Wireshark 实验 : DNS 


在 本 实验 中 ， 我 们 仔细 观察 DNS 的 客户 端 (DNS 是 用 于 将 因特网 主机 名 转换 为 IP 地 址 的 协议 ) 。 
2.4 WH, E DNS 中 客户 角色 是 相当 简单 的 : 客户 向 它 的 本 地 DNS 服务 器 发 送 一 个 请 求 ， 并 接收 返回 
的 响应 。 在 此 过 程 中 发 生 的 很 多 事情 均 不 为 DNS 客户 所 见 ， 如 等 级 结构 的 DNS 服务 器 互相 通信 递归 地 或 
迭代 地 解析 该 客户 的 DNS 请 求 。 然 而 ， 从 DNS 客户 的 角度 而 言 ， 该 协议 是 相当 简单 的 ， 即 向 本 地 DNS 
服务 器 发 送 一 个 请 求 ， 从 该 服务 器 接收 一 个 响应 。 在 本 实验 中 我 们 观察 运转 中 的 DNS, 

如 同 所 有 的 Wireshark 实验 一 样 ， 在 本 书 的 Web 站 点 http://www. awl. com/kurose- ross 可 以 找到 本 实 
验 的 完整 描述 。 


WM 人 物 专访 


Marc Andreessen 是 Mosaic 的 共同 发 明 人 ，Mosaic 是 一 种 Web WEB, EX 
它 使 万 维 网 在 1993 年 流行 起 来 。Mosaic 具有 一 个 清晰 、 易 于 理解 的 界面 ， 是 首 
个 能 识 在 文本 中 显示 图 像 的 浏览 器 。 在 1994 年 ，Marc Andreessen 和 Jim Clark 
创办 了 Netscape 公司 ， 其 浏览 器 是 到 20 世纪 90 年 代 中 期 为 止 最 为 流行 的 。 
Netscape 也 研发 了 安全 套 接 字 层 (SSL) 协议 和 许多 因特网 服务 器 产品 ， 包 括 
邮件 服务 器 和 基于 SSL 的 Web 服务 器 。 他 现在 是 风险 投资 公司 Andreessen 
Horowitz 的 共同 芮 基 人 和 一 般 股 东 ， 对 包括 Facebook, Foursquare, Groupon, 
Jawbone, Twitter 和 Zynga 等 公司 的 财产 投资 搭配 进行 监管 。 他 服务 于 包括 
Bump, eBay, Glam Media, Facebook 和 HP 等 在 内 的 多 个 董事 会 。 他 具有 美国 
伊利 诺 伊 大 学 厄 巴 纳 - 香槟 分 校 的 计算 机 科学 理学 学 士 学 位 。 





Marc Andreessen 


© 您 是 怎样 变 得 对 计算 感 兴趣 的 ?您 过 去 一 直 知 道 您 要 从 事 信息 技术 吗 ? 

在 我 长 大 成 人 的 过 程 中 ， 视 频 游戏 和 个 人 计算 正好 成 为 成 功 而 风行 一 时 的 事物 ,在 20 世纪 70 年代 后 
期 和 80 年 代 初 期 个 人 计算 成 为 新 技术 发 展 前 沿 。 那 时 不 只 有 苹果 和 IBM 的 个 人 计算 机 ， 而 且 有 如 Com- 
modore 和 Atari 等 数 以 百 计 的 新 公司 。 我 在 10 岁 时 用 一 本 名 为 《简明 BASIC 速成 》 (Instant Freeze- Dried 
BASIC) 的 书 进行 自学 ， 并 在 12 岁 时 得 到 自己 的 第 一 台 计 算 机 (TRS-80 Color Computer， 查 查 它 !1)。 

。 请 描述 您 职业 生源 中 干 过 的 一 两 个 最 令 人 激动 的 项 目 。 最 大 的 挑战 是 什么 ? 

考 良 置疑， 最 令 人 兴奋 的 项 目 是 1992 ~ 1993 年 的 初始 Mosaic Web 浏览 器 ， 最 大 的 挑战 是 让 任何 人 从 
此 往 后 都 认真 地 对 竺 它 。 在 那个 时 候 ， 每 个 人 都 认为 交互 式 未 来 将 是 由 大 型 公司 宣布 的 “交互 式 电视 ”， 
而 非 由 新 兴 公 司 发 明 的 因特网 。 

© 您 对 网 络 和 因特网 未 来 的 什么 东西 感到 兴奋 ?您 最 为 关注 什么 ? 

最 为 兴奋 的 东西 是 程序 员 和 企业 家 能 够 探索 的 巨大 的 尚 竺 开发 的 应 用 和 服务 领域 ， 即 因特网 已 经 释 
放 的 创造 性 到 达 了 一 种 我 们 以 前 从 未 预见 到 的 水 平 。 我 最 关注 是 “ 意 想 不 到 的 后 果 ” 的 原则 ， 即 我 们 并 
不 总 是 知道 我 们 所 做 事情 的 后 果 ， 例 如 因特网 被 政府 所 用 ， 使 监视 居民 到 达 了 一 种 新 水 平 。 

。 随 着 Web 技术 的 进展 ， 学 生 们 有 什么 应 当 特 别 要 了 解 的 ? 

改变 的 速度 ， 即 对 学 习 来 说 ， 最 重要 的 东西 是 学 习 的 方法 ， 在 特定 的 技术 中 如 何 灵活 地 适应 改变 ， 
当 你 在 职业 生涯 中 前 行 时 ， 在 新 的 机 会 和 可 能 性 方面 如 何 保持 开放 的 思想 。 

© 是 谁 激发 了 您 的 职业 灵感 ? 

他 们 是 : Vannevar Bush, Ted Nelson, Doug Engelgart, Nolan Bushnell, Bill Hewlett 和 Dave Packard, Ken 
Olsen, Steve Jobs, Steve Wozniak, Andy Grove, Grace Hopper, Hedy Lamarr, Alan Turing, Richard Stallman, 

© 对 于 要 在 计算 和 信息 技术 领域 谋求 发 展 的 学 生 ， 您 有 什么 忠告 ? 

尽 可 能 深入 地 理解 技术 是 怎样 创造 的 ， 然 后 补充 学 习 商 业 运 作 的 原理 。 

。 技术 能 够 解决 世界 的 问题 吗 ? 

不 能 ， 但 是 通过 经 济 增长 我 们 推动 人 们 生活 标准 的 改善 。 综 观 历 史 ， 大 多 数 经 济 增长 来 自 技 术 ， 因 
此 就 像 技 术 带 来 的 好 处 一 样 。 
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运输 层 位 于 应 用 层 和 网 络 层 之 间 ， 是 分 层 的 网 络 体系 结构 的 重要 部 分 。 该 层 为 运行 在 
不 同 主机 上 的 应 用 进程 提供 直接 的 通信 服务 起 着 至 关 重 要 的 作用 。 我 们 在 本 章 采 用 的 教学 
方法 是 ， 交 替 地 讨论 运输 层 的 原理 和 这 些 原理 在 现 有 的 协议 中 是 如 何 实现 的 。 与 往常 一 
样 ， 我 们 将 特别 关注 因特网 协议 ， 即 TCP 和 UDP 运输 层 协议 。 

我 们 将 从 讨论 运输 层 和 网 络 层 的 关系 开始 。 这 就 为 研究 运输 层 第 一 个 关键 功能 打 好 了 
基础 ， 即 将 网 络 层 的 在 两 个 端 系 统 之 间 的 交付 服务 扩展 到 运行 在 两 个 不 同 端 系统 上 的 应 用 
层 进程 之 间 的 交付 服务 。 我 们 将 在 讨论 因特网 的 无 连接 运输 协议 UDP 时 闻 述 这 个 功能 。 

然后 我 们 重新 回 到 原理 学 习 上 ， 面 对 计算 机 网 络 中 最 为 基础 性 的 问题 之 一 ， 即 两 个 实 
体 怎样 才能 在 一 种 会 丢失 或 损坏 数据 的 媒体 上 可 靠 地 通信 。 通 过 一 系列 复杂 性 不 断 增加 
hoo i neir tne ed gd 

， 我 们 将 说 明 这 些 原理 是 如 何 体现 在 因特网 面向 连接 的 运输 协议 TCP 中 的 。 

接 下 来 我 们 讨论 网 络 中 的 第 二 个 基础 性 的 重要 问题 ， 即 控制 运输 层 实体 的 传输 速率 以 
避免 网 络 中 的 拥塞 ， 或 从 拥塞 中 恢复 过 来 。 我 们 将 考虑 拥塞 的 原因 和 后 果 ， 以 及 常用 的 拥 
塞 控制 技术 。 在 透彻 地 理解 了 拥塞 控制 问题 之 后 ， 我 们 将 研究 TCP 应 对 拥塞 控制 的 方法 。 


3.1 概述 和 运输 层 服务 


在 前 两 章 中 ， 我 们 已 对 运输 层 的 作用 及 其 所 提供 的 服务 有 所 了 解 。 现 在 我 们 快速 地 回 
顾 一 下 前 面 学 过 的 有 关 运 输 层 的 知识 。 

运输 层 协议 为 运行 在 不 同 主机 上 的 应 用 进程 之 间 提 供 了 逻辑 通信 (logic communica- 
tion) 功能 。 从 应 用 程序 的 角度 看 ， 通 过 还 辑 通信 ， 运 行 不 同 进程 的 主机 好 像 直 接 相 连 一 
样 ; 实际 上 ， 这 些 主机 也 许 位 于 地 球 的 两 人 出， 通过 很 多 路 由 器 及 多 种 不 同类 型 的 链 路 相 
连 。 应 用 进程 使 用 运输 层 提供 的 逻辑 通信 功能 彼此 发 送 报 文 ， 而 无 须 考虑 承载 这 些 报 文 的 
物理 基础 设施 的 细节 。 图 3-1 图 示 了 逻辑 通信 的 概念 。 

如 图 3-1 所 示 ， 运 输 层 协议 是 在 端 系 统 中 而 不 是 在 路 由 器 中 实现 的 。 在 发 送 端 ， 运 输 
层 将 从 发 送 应 用 程序 进程 接收 到 的 报 文 转换 成 运输 层 分 组 ， 用 因特网 术语 来 讲 该 分 组 称 为 
运输 层 报 文 段 (segment) 。 实 现 的 方法 (可能) 是 将 应 用 报 文 划 分 为 较 小 的 块 ， 并 为 每 块 
加 上 一 个 运输 层 首 部 以 生成 运输 层 报 文 段 。 然 后 ， 在 发 送 端 系统 中 ， 运 输 层 将 这 些 报 文 段 
传递 给 网 络 层 ， 网 路 层 将 其 封装 成 网 络 层 分 组 〈 即 数据 报 ) 并 回 目的 地 发 送 。 注 意 到 下 列 
事实 是 重要 的 : 网 络 路 由 器 仅 作 用 于 该 数据 报 的 网 络 层 字段 ; 即 它们 不 检查 封装 在 该 数据 
报 的 运输 层 报 文 段 的 字段 。 在 接收 端 ， 网 络 层 从 数据 报 中 提取 运输 层 报 文 段 ， 并 将 该 报 文 
段 铝 上 交 给 运输 层 。 运 输 层 则 处 理 接收 到 的 报 文 段 ， 使 该 报 文 段 中 的 数据 为 接收 应 用 进程 
使 用 。 

网 络 应 用 程序 可 以 使 用 多 种 的 运输 层 协议 。 例 如 ， 因 特 网 有 两 种 协议 ， 即 TCP 和 
UDP。 每 种 协议 都 能 为 调用 的 应 用 程序 提供 一 组 不 同 的 运输 层 服务 。 
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图 3-1 运输 层 在 应 用 程序 进程 间 提 供 逻 辑 的 而 非 物 理 的 通信 


3. 1.1 运输 层 和 网 络 层 的 关系 


前 面 讲 过 ， 在 协议 栈 中 ， 运 输 层 刚好 位 于 网 络 层 之 上 。 网 络 层 提供 了 主机 之 间 的 逻辑 
通信 ， 而 运输 层 为 运行 在 不 同 主机 上 的 进程 之 间 提 供 了 逻辑 通信 。 这 种 差别 虽然 细微 但 很 
重要 。 我 们 用 一 个 家 庭 类 比 来 帮助 分 析 这 种 差别 。 

考虑 有 两 个 家 庭 ， 一 家 位 于 美国 东海 岸 ， 一 家 位 于 美国 西海 岸 ， 每 家 有 12 个 孩子 。 
东海 岸 家 庭 的 孩子 们 是 西海 岸 家 庭 孩子 们 的 答 兄 第 姐妹 。 这 两 个 家 庭 的 孩子 们 喜欢 彼此 通 
信 ， 每 个 人 每 星期 要 互相 写 一 封 信 ， 每 封 信 都 用 单独 的 信封 通过 传统 的 邮政 服务 传送 。 因 
此 ， 每 个 家 庭 每 星期 向 另 一 家 发 送 144 封 信 。 (如果 他 们 有 电子 邮件 的 话 ， 这 些 孩 子 可 以 
省 不 少 钱 !) 每 一 个 家 庭 有 个 孩子 负责 收发 邮件 ， 西 海岸 家 庭 是 An 而 东海 岸 家 庭 是 Bill, 
每 星期 Ann 去 她 的 所 有 兄弟 姐妹 那里 收集 信件 ， 并 将 这 些 信件 交 到 每 天 到 家 门口 来 的 邮政 
服务 的 邮 车 上 。 当 信件 到 达 西 海岸 家 庭 时 ，Ann 也 负责 将 信件 分 发 到 她 的 兄弟 姐妹 手 上 。 
在 东海 岸 家 庭 中 的 Bil 也 负责 类 似 的 工作 。 


在 这 个 例子 中 ， 邮 政 服务 为 两 个 家 庭 间 提供 逻辑 通信 ， 邮 政 服务 将 信件 从 一 家 送 往 另 
一 家 ， 而 不 是 从 一 个 人 送 往 另 一 个 人 。 在 另 一 方面 ，Ann 和 Bill 为 党 兄弟 姐妹 之 间 提 供 了 
i H(A, Ann 和 Bill 从 兄弟 姐妹 那里 收取 信件 或 到 兄弟 姐妹 那里 交付 信件 。 注 意 到 从 党 
兄弟 姐妹 们 的 角度 来 看 ，Ann 和 Bill 就 是 邮件 服务 ， 尽 管 他 们 只 是 端 到 端 交 付 过 程 的 一 部 
分 ( 即 端 系统 部 分 ) 。 在 解释 运输 层 和 网 络 层 之 间 的 关系 时 ， 这 个 家 庭 的 例子 是 一 个 非常 
好 的 类 比 。 

应 用 层 报 文 = 信封 上 的 字符 

进程 = 堂 兄弟 姐妹 

主机 (又 称 为 端 系统 ) = 家 庭 
运输 层 协 议 = Ann 和 Bill 
网 络 层 协议 = 邮政 服务 (包括 邮 车 ) 

我 们 继续 观察 这 个 类 比 。 值 得 注意 的 是 ，Ann 和 Bil 都 是 在 各 自家 里 进行 工作 的 ; 例 
如 ， 他 们 并 没有 参与 任何 一 个 中 间 邮 件 中 心 对 邮件 进行 分 拣 ， 或 者 将 邮件 从 一 个 邮件 中 心 
送 到 另 一 个 邮件 中 心 之 类 的 工作 。 类 似 地 ， 运 输 层 协议 只 工作 在 端 系统 中 。 在 端 系统 中 ， 
运输 层 协议 将 来 自 应 用 进程 的 报 文 移动 到 网 络 边缘 〈 即 网 络 层 ) ， 反 过 来 也 是 一 样 ， 但 对 
有 关 这 些 报 文 在 网 络 核心 如 何 移动 并 不 作 任 何 规定 。 事 实 上 ， 如 图 3-1 所 示 ， 中 间 路 由 器 
既 不 处 理 也 不 识别 运输 层 加 在 应 用 层 报 文 的 任何 信息 。 

我 们 还 是 继续 讨论 这 两 家 的 情况 。 现 在 假定 Ann 和 Bill 外 出 度假 ， 男 外 一 对 党 兄妹 
(如 Susan 和 Harvey) 接替 他 们 的 工作 ， 在 家 庭 内 部 进行 信件 的 收集 和 交付 工作 。 不 幸 的 
是 ，Susan 和 Harvey 的 收集 和 交付 工作 与 Ann 和 Bill 所 做 的 并 不 完全 一 样 。 由 于 年 龄 更 
小 ，Susan 和 Harvey 收发 邮件 的 次 数 更 少 ， 而 且 偶尔 还 会 丢失 邮件 (有 时 是 被 家 里 的 狗 咬 
SRT). Flt, Susan 和 Harvey 这 对 党 兄妹 并 没有 提供 与 Ann 和 Bill 一 样 的 服务 集合 (B 
相同 的 服务 模型 ) 。 与 此 类 似 ， 计 算 机 网 络 中 可 以 安排 多 种 运输 层 协 议 ， 每 种 协议 为 应 用 
程序 提供 不 同 的 服务 模型 。 

Ann 和 Bill 所 能 提供 的 服务 明显 受制 于 邮政 服务 所 能 提供 的 服务 。 例 如 ， 如 果 邮 政 服 
务 不 能 提供 在 两 家 之 间 传 递 邮件 所 需 时 间 的 最 长 期 限 (例如 3 R), 那么 Ann 和 Bill 就 不 
可 能 保证 邮件 在 党 兄弟 姐妹 之 间 传 递 信 件 的 最 长 期 限 。 与 此 类 似 ， 运输 协议 能 够 提供 的 服 
务 常 常 受制 于 底层 网 络 层 协议 的 服务 模型 。 如 果 网 络 层 协议 无 法 为 主机 之 间 发 送 的 运输 层 
报 文 段 提供 时 延 或 带宽 保证 的 话 ， 运 输 层 协议 也 就 无 法 为 进程 之 间 发 送 的 应 用 程序 报 文 提 
供 时 延 或 带宽 保证 。 

然而 ， 即 使 底层 网 络 协议 不 能 在 网 络 层 提供 相应 的 服务 ， 运 输 层 协议 也 能 提供 某 些 服 
务 。 例 如 ， 如 我 们 将 在 本 章 所 见 ， 即 使 底层 网 络 协议 是 不 可 靠 的 ， 也 就 是 说 网 络 层 协议 会 
使 分 组 丢失 、 自 改 和 宛 余 ， 运 输 协 议 也 能 为 应 用 程序 提供 可 靠 的 数据 传输 服务 。 另 一 个 例 
子 是 (我 们 在 第 8 章 讨论 网 络 安全 时 将 会 研究 到 ) ， 即 使 网 络 层 不 能 保证 运输 层 报 文 段 的 
机 密 性 ， 运 输 协议 也 能 使 用 加 密 来 确保 应 用 程序 报 文 不 被 人 侵 者 读 取 。 


3. 1.2 因特网 运输 层 概 述 


前 面 讲 过 因特网 为 应 用 层 提 供 了 两 种 截然 不 同 的 可 用 运输 层 协议 。 这 些 协 议 一 种 是 
UDP 〈 用 户 数 据 报 协议 ) ， 它 为 调用 它 的 应 用 程序 提供 了 一 种 不 可 靠 、 无 连接 的 服务 。 男 
一 种 是 TCP (传输 控制 协议 ) ， 它 为 调用 它 的 应 用 程序 提供 了 一 种 可 靠 的 、 面 向 连接 的 服 
务 。 当 设计 一 个 网 络 应 用 程序 时 ， 该 应 用 程序 的 开发 人 员 必 须 指定 使 用 这 两 种 运输 协议 中 
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的 哪 一 种 。 如 我 们 在 2.7 节 看 到 的 那样 ， 应 用 程序 开发 人 员 在 生成 套 接 字 时 必须 指定 是 选 
择 UDP 还 是 选择 TCP。 

为 了 简化 术语 ， 我 们 将 运输 层 分 组 称 为 报 文 段 ( segment)。 然 而 ， 因 特 网 文献 (如 
RFC 文档 ) 也 将 TCP 的 运输 层 分 组 称 为 报 文 段 ， 而 和 常 将 UDP 的 分 组 称 为 数据 报 ( data- 
gram) 。 而 这 类 因特网 文献 也 将 网 络 层 分 组 称 为 数据 报 ! 本 书 作 为 一 本 计算 机 网 络 的 入 门 
书籍 ， 我 们 认为 将 TCP 和 UDP 的 分 组 统称 为 报 文 段 ， 而 将 数据 报名 称 保留 给 网 络 层 分 组 
不 容易 混 消 。 

在 对 UDP 和 TCP 进行 简要 介绍 之 前 ， 简 单 介 绍 一 下 因特网 的 网 络 层 (我 们 将 在 第 4 和 5 
章 中 详细 地 学 习 网 络 层 ) 是 有 用 的 。 因 特 网 网 络 层 协议 有 一 个 名 字 叫 下 ， 即 网 际 协议 。 了 亚 
为 主机 之 间 提 供 了 逻辑 通信 。IP 的 服务 模型 是 尽力 而 为 交付 服务 (best-effort delivery serv- 
ice)。 这 意味 着 IP 尽 它 “最 大 的 努力 ”在 通信 的 主机 之 间 交 付 报 文 段 ， 但 它 并 不 做 任何 确 
保 。 特 别 是 ， 它 不 确保 报 文 段 的 交付 ， 不 保证 报 文 段 的 按 序 交 付 ， 不 保证 报 文 段 中 数据 的 
完整 性 。 由 于 这 些 原因 ， 卫 被 称 为 不 可 靠 服 务 (unreliable service ) 。 在 此 还 要 指出 的 是 ， 
每 台 主 机 至 少 有 一 个 网 络 层 地 址 ， 即 所 谓 的 IP 地 址 。 我 们 在 第 4 和 5 章 将 详细 讨论 IP 地 
址 ; 在 这 一 章 中 ， 我们 只 需要 记 住 每 台 主 机 有 一 个 IP 地址 。 

在 对 IP 服务 模型 有 了 初步 了 解 后 ， 我 们 总 结 一 下 UDP 和 TCP 所 提供 的 服务 模型 。 
UDP 和 TCP 最 基本 的 责任 是 ， 将 两 个 端 系统 间 IP 的 交付 服务 扩展 为 运行 在 端 系统 上 的 两 
个 进程 之 间 的 交付 服务 。 将 主机 间 交 付 扩 展 到 进程 间 交 付 被 称 为 运输 层 的 多 路 复 用 
(transport-layer multiplexing) 与 多 路 分 解 (demultiplexing) 。 我 们 将 在 下 一 节 讨 论 运 输 层 的 
多 路 复 用 与 多 路 分 解 。UDP 和 TCP 还 可 以 通过 在 其 报 文 段 首部 中 包括 差错 检查 字段 而 提 
供 完整 性 检查 。 进 程 到 进程 的 数据 交付 和 差错 检查 是 两 种 最 低 限 度 的 运输 层 服务 ， 也 是 
UDP 所 能 提供 的 仅 有 的 两 种 服务 。 特 别 是 ,与 卫 一 样 ，UDP 也 是 一 种 不 可 靠 的 服务 ， 即 
不 能 保证 一 个 进程 所 发 送 的 数据 能 够 完整 无 缺 地 (或 全 部 !) 到 达 目 的 进程 。 在 3.3 节 中 
将 更 详细 地 讨论 UDP。 

男 一 方面 ，TCP 为 应 用 程序 提供 了 几 种 附加 服务 。 首 先 ， 它 提供 可 靠 数 据 传 输 (relia- 
ble data transfer) 。 通 过 使 用 流量 控制 、 序 号 、 确 认 和 定时 部 〈 本 章 将 详细 介绍 这 些 技术 ) ， 
TCP 确保 正确 地 、 按 序 地 将 数据 从 发 送 进程 交付 给 接收 进程 。 这 样 ，TCP 就 将 两 个 端 系统 
间 的 不 可 靠 卫 服务 转换 成 了 一 种 进程 间 的 可 靠 数 据 传输 服务 。TCP 还 提供 拥塞 控制 con- 
gestion control) 。 拥 塞 控制 与 其 说 是 一 种 提供 给 调用 它 的 应 用 程序 的 服务 ， 不 如 说 是 一 种 
提供 给 整个 因特网 的 服务 ， 这 是 一 种 带 来 通用 好 处 的 服务 。 不 太 严 格 地 说 ，TCP 拥塞 控制 
防止 任何 一 条 TCP 连接 用 过 多 流量 来 淹没 通信 主机 之 间 的 链 路 和 交换 设备 。TCP 力求 为 每 
个 通过 一 条 拥塞 网 络 链 路 的 连接 平等 地 共享 网 络 链 路 带宽 。 这 可 以 通过 调节 TCP 连接 的 发 
送 端 发 送 进 网 络 的 流量 速率 来 做 到 。 在 另 一 方面 ，UDP 流量 是 不 可 调节 的 。 使 用 UDP 传 
输 的 应 用 程序 可 以 根据 其 需要 以 其 愿意 的 任何 速率 发 送 数 据 。 

一 个 能 提供 可 靠 数 据 传 输 和 拥塞 控制 的 协议 必定 是 复杂 的 。 我 们 将 用 几 节 的 篇 幅 来 介 
绍 可 靠 数据 传输 和 拥塞 控制 的 原理 ， 用 另外 几 节 介绍 TCP 协议 本 身 。3.4 ~3.8 节 将 研究 
这 些 主题 。 本 草 采 取 基 本 原理 和 TCP 协议 交替 介绍 的 方法 。 例 如 ， 我 们 首先 在 一 般 环境 下 
讨论 可 靠 数据 传输 ， 然 后 讨论 TCP 是 怎样 具体 提供 可 靠 数 据 传 输 的 。 类 似 地 ， 先 在 一 般 环 
境 下 讨论 拥塞 控制 ， 然 后 讨论 TCP 是 怎样 实现 拥塞 控制 的 。 但 在 全 面 介绍 这 些 内 容 之 前 ， 
我 们 先 学 习 运 输 层 的 多 路 复 用 与 多 路 分 解 。 


3.2 多 路 复 用 与 多 路 分 解 


在 本 节 中 ， 我 们 讨论 运输 层 的 多 路 复 用 与 多 路 分 解 ， 也 就 是 将 由 网 络 层 提 供 的 主机 到 
主机 交付 服务 延伸 到 为 运行 在 主机 上 的 应 用 程序 提供 进程 到 进程 的 交付 服务 。 为 了 使 讨论 
具体 起 见 ， 我 们 将 在 因特网 环境 中 讨论 这 种 基本 的 运输 层 服务 。 然 而 ， 需 要 强调 的 是 ， 多 
路 复 用 与 多 路 分 解 服务 是 所 有 计算 机 网 络 都 需要 的 。 

在 目的 主机 ， 运 输 层 从 紧邻 其 下 的 网 络 层 接收 报 文 段 。 运 输 层 负 责 将 这 些 报 文 段 中 的 
数据 交付 给 在 主机 上 运行 的 适当 应 用 程序 进程 。 我 们 来 看 一 个 例子 。 假 定 你 正 坐 在 计算 机 
前 下 载 Web 页 面 ， 同 时 还 在 运行 一 个 FTP 会 话 和 两 个 Telnet 会 话 。 这 样 你 就 有 4 个 网 络 应 
用 进程 在 运行 ， 即 两 个 Telnet 进程 ， 一 个 FTP 进程 和 一 个 HTTP 进程 。 当 你 的 计算 机 中 的 
运输 层 从 底层 的 网 络 层 接 收 数据 时 ， 它 需要 将 所 接收 到 的 数据 定向 到 这 4 个 进程 中 的 一 
个 。 现 在 我 们 来 研究 这 是 怎样 完成 的 。 

首先 回想 2.7 节 的 内 容 ， 一 个 进程 〈 作 为 网 络 应 用 的 一 部 分 ) 有 一 个 或 多 个 套 接 字 
(socket) ， 它 相当 于 从 网 络 向 进程 传递 数据 和 从 进程 向 网 络 传递 数据 的 门户 。 因 此 ， 如 
图 3-2 所 示 ， 在 接收 主机 中 的 运输 层 实 际 上 并 没有 直接 将 数据 交付 给 进程 ， 而 是 将 数据 交 
给 了 一 个 中 间 的 套 接 字 。 由 于 在 任 一 时 刻 ， 在 接收 主机 上 可 能 有 不 止 一 个 套 接 字 ， 所 以 每 
个 套 接 字 都 有 唯一 的 标识 符 。 标 识 符 的 格式 取决 于 它 是 UDP 还 是 TCP 套 接 字 ， 我 们 将 很 
快 对 它们 进行 讨论 。 
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图 3-2 ”运输 层 的 多 路 复 用 与 多 路 分 解 


现在 我 们 考虑 接收 主机 怎样 将 一 个 到 达 的 运输 层 报 文 段 定向 到 适当 的 套 接 字 。 为 此 目 
的 ， 每 个 运输 层 报 文 段 中 具有 几 个 字段 。 在 接收 端 ， 运 输 层 检查 这 些 字 段 ， 标 识 出 接收 套 
接 字 ， 进 而 将 报 文 段 定 向 到 该 套 接 字 。 将 运输 层 报 文 段 中 的 数据 交付 到 正确 的 套 接 字 的 工 
作 称 为 多 路 分 解 (demultiplexing) 。 在 源 主 机 从 不 同 套 接 字 中 收集 数据 块 ， 并 为 每 个 数据 
块 封装 上 首部 信息 (这 将 在 以 后 用 于 分 解 ) 从 而 生成 报 文 段 ， 然 后 将 报 文 段 传递 到 网 络 
层 ， 所 有 这 些 工作 称 为 多 路 复 用 ( multiplexing) 。 值 得 注意 的 是 ， 图 3-2 中 的 中 间 那 台 主 
机 的 运输 层 必须 将 从 其 下 的 网 络 层 收 到 的 报 文 段 分 解 后 交 给 其 上 的 P 或 P, 进程 ; 这 一 过 
程 是 通过 将 到 达 的 报 文 段 数据 定向 到 对 应 进程 的 套 接 字 来 完成 的 。 中 间 主 机 中 的 运输 层 也 
必须 收集 从 这 些 套 接 字 输 出 的 数据 ， 形 成 运输 层 报 文 段 ， 然 后 将 其 向 下 传递 给 网 络 层 。 尺 
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管 我 们 在 因特网 运输 层 协议 的 环境 下 引入 了 多 路 复 用 和 多 路 分 解 ， 认 识 到 下 列 事实 是 重要 
的 : 它们 与 在 某 层 (在 运输 层 或 别处 ) 的 单一 协议 何 时 被 位 于 接 下 来 的 较 高 层 的 多 个 协议 
使 用 有 关 。 

为 了 说 明 分 解 的 工作 过 程 ， 再 回顾 一 下 前 面 一 节 的 家 庭 类 比 。 每 一 个 孩子 通过 他 们 的 
名 字 来 标识 。 当 Bill 从 邮递 员 处 收 到 一 批 信件 ， 并 通过 查看 收 信 人 名 字 而 将 信件 亲手 交付 
给 他 的 兄弟 姐妹 们 时 ， 他 执行 的 就 是 一 个 分 解 操 作 。 当 Ann 从 兄弟 姐妹 们 那里 收集 信件 并 
将 它们 交 给 邮递 员 时 ， 她 执行 的 就 是 一 个 多 路 复 用 操作 。 

既然 我 们 理解 了 运输 层 多 路 复 用 与 多 路 分 解 的 作用 ， 那 就 再 来 看 看 在 主机 中 它们 实际 
是 怎样 工作 的 。 通 过 上 述 讨 论 ， 我们 知道 运输 层 多 路 复 用 要 求 : 中 套 接 字 有 唯一 标识 符 ; 
@ 每 个 报 文 段 有 特殊 字段 来 指示 该 报 文 段 所 要 交付 到 的 套 接 字 。 如 图 3-3 所 示 ， 这 些 特殊 
字段 是 源 端口 号 字段 ( source port number field) 和 目的 端口 
号 字段 (destination port number field), (UDP 报 文 段 和 TCP 
报 文 段 还 有 其 他 的 一 些 字 段 ， 这 些 将 在 本 章 后 继 几 节 中 进行 
Wit.) 端口 号 是 一 个 16 比特 的 数 ， 其 大 小 在 0 ~ 65535 之 
间 。0 ~ 1023 范围 的 端口 号 称 为 周知 端口 号 (well-known port 
number) ， 是 受 限 制 的 ， 这 是 指 它们 保留 给 诸如 HTTP ( 它 使 
用 端口 号 80) A FTP ( 它 使 用 端口 号 21) 之 类 的 周知 应 用 层 
协议 来 使 用 。 周 知 端口 的 列表 在 RFC 1700 中 给 出 ， 同 时 在 
http://www. iana. org 上 有 更 新 文档 [RFC 3232 ] 。 当 我 们 开发 。 图 3-3 运输 层 报 文 段 中 的 
一 个 新 的 应 用 程序 时 (如 在 2.7 节 中 开发 的 一 个 简单 应 用 程 W BBS Be 
序 ) ， 必 须 为 其 分 配 一 个 端口 号 。 

现在 应 该 清楚 运输 层 是 怎样 能 够 实现 分 解 服务 的 了 : 在 主机 上 的 每 个 套 接 字 能 够 分 配 
一 个 端口 号 ， 当 报 文 段 到 达 主 机 时 ， 运 输 层 检查 报 文 段 中 的 目的 端口 号 ， 并 将 其 定向 到 相 
应 的 套 接 字 。 然 后 报 文 段 中 的 数据 通过 套 接 字 进 入 其 所 连接 的 进程 。 如 我 们 将 看 到 的 那 
样 ，UDP 大 体 上 是 这 样 做 的 。 然 而 ， 也 将 如 我 们 所 见 ，TCP 中 的 多 路 复 用 与 多 路 分 解 更 为 
复杂 。 

1. 无 连接 的 多 路 复 用 与 多 路 分 解 


2.7.1 节 讲 过 ,在 主机 上 运行 的 Python 程序 使 用 下 面 一 行 代码 创建 了 一 个 UDP 套 
RF: 


clientSocket = socket(AF_INET, SOCK_DGRAM) 


当 用 这 种 方式 创建 一 个 UDP 套 接 字 时 ， 运 输 层 自动 地 为 该 套 接 字 分 配 一 个 端口 号 。 
特别 是 ， 运 输 层 从 范围 1024 ~65535 内 分 配 一 个 端口 号 ， 该 端口 号 是 当前 未 被 该 主机 中 任 
何其 他 UDP 端口 使 用 的 号 。 另 外 一 种 方法 是 ， 在 创建 一 个 套 接 字 后 ， 我 们 能 够 在 Python 
程序 中 增加 一 行 代 码 ， 通 过 套 接 字 bind() 方法 为 这 个 UDP 套 接 字 关联 一 个 特定 的 端口 号 
(如 19157): 


clientSocket.bind((’’, 19157)) 


如 果 应 用 程序 开发 者 所 编写 的 代码 实现 的 是 一 个 “周知 协议 ”的 服务 器 端 ， 那 么 开发 
者 就 必须 为 其 分 配 一 个 相应 的 周知 端口 号 。 通 常 ， 应 用 程序 的 客户 端 让 运输 层 目 动 地 〈 并 
且 是 透明 地 ) 分 配 端口 号 ， 而 服务 器 端 则 分 配 一 个 特定 的 端口 号 。 

通过 为 UDP 套 接 字 分 配 端口 号 ， 我 们 现在 能 够 精确 地 描述 UDP 的 复 用 与 分 解 了 。 假 





定 在 主机 A 中 的 一 个 进程 具有 UDP 端口 19157， 它 要 发 送 一 个 应 用 程序 数据 块 给 位 于 主机 
B 中 的 男 一 进程 ， 该 进程 具有 UDP 端口 46428。 主 机 A 中 的 运输 层 创 建 一 个 运输 层 报 文 
段 ， 其 中 包括 应 用 程序 数据 、 源 端口 号 (19157) 、 目 的 端口 号 (46428) 和 两 个 其 他 值 
(将 在 后 面 讨论 ， 它 对 当前 的 讨论 并 不 重要 )。 然 后 ， 运 输 层 将 得 到 的 报 文 段 传递 到 网 络 
层 。 网 络 层 将 该 报 文 段 封装 到 一 个 P 数据 报 中 ， 并 尽力 而 为 地 将 报 文 段 交 付 给 接收 主机 。 
如 果 该 报 文 段 到 达 接 收 主机 B， 接 收 主机 运输 层 就 检查 该 报 文 段 中 的 目的 端口 号 46428 ) 
并 将 该 报 文 段 交付 给 端口 号 46428 所 标识 的 套 接 字 。 值 得 注意 的 是 ， 主 机 B 能 够 运行 多 个 
进程 ， 每 个 进程 有 自己 的 UDP 套 接 字 及 相应 的 端口 号 。 值 得 注意 的 是 ， 主 机 B 可 能 运行 
多 个 进程 ， 每 个 进程 都 具有 其 自己 的 UDP 套 接 字 和 相 联 系 的 端口 号 。 当 UDP 报 文 段 从 网 
络 到 达 时 ， 主 机 B 通过 检查 该 报 文 段 中 的 目的 端口 号 ， 将 每 个 报 文 段 定向 (分解) 到 相 
应 的 套 接 字 。 

注意 到 下 述 事实 是 重要 的 : 一 个 UDP 套 接 字 是 由 一 个 二 元 组 全 面 标识 的 ， 该 二 元 组 
包含 一 个 目的 IP 地 址 和 一 个 目的 端口 号 。 因 此 ， 如 果 两 个 UDP 报 文 段 有 不 同 的 源 IP 地 址 
和 /或 源 端 口号 ， 但 具有 相同 的 目的 IP 地址 和 目的 端口 号 ， 那 么 这 两 个 报 文 段 将 通过 相同 
的 目的 套 接 字 被 定向 到 相同 的 目的 进程 。 

你 也 许 现 在 想 知 道 ， 源 端口 号 的 用 途 是 什么 呢 7 如 图 3-4 所 示 ， 在 A 到 B 的 报 文 段 中 ， 
源 端口 号 用 作 “ 返 回 地 址 ”的 一 部 分 ， 即 当 B 需要 回 发 一 个 报 文 段 给 A 时 ，B 到 A 的 报 文 
段 中 的 目的 端口 号 便 从 A 到 B 的 报 文 段 中 的 源 端 口号 中 取 值 。( 完整 的 返回 地 址 是 A AY IP Hh 
址 和 源 端口 号 。) 举 一 个 例子 ， 回 想 2.7 节 学 习 过 的 那个 UDP 服务 需 程 序 。 在 UDPServer. py 
中 ， 服 务 器 使 用 recvfrom() 方 法 从 其 自 客户 接收 到 的 报 文 段 中 提取 出 客户 端 ( 源 ) 端口 号 ， 
然后 ， 它 将 所 提取 的 源 端口 号 作为 目的 端口 号 ， 向 客户 发 送 一 个 新 的 报 文 段 。 


客户 进程 
ERF 







服务 器 B 





源 端 口 : Haw: 
19157 46428 





= 


源 端 口 : ”目的 端口: 
46428 19157 


图 3-4 源 端 口号 与 目的 端口 号 的 反 转 


2. 面向 连接 的 多 路 复 用 与 多 路 分 解 

为 了 理解 TCP 多 路 分 解 ， 我 们 必须 更 为 仔细 地 研究 TCR EFA TCP 连接 创建 。TCP 
套 接 字 和 UDP 套 接 字 之 间 的 一 个 细微 差别 是 ，TCP 套 接 字 是 由 一 个 四 元 组 ( 源 IP Hed, 
源 端口 号 ， 目 的 瑟 地 址 ， 目 的 端口 号 ) 来 标识 的 。 因 此 ， 当 一 个 TCP 报 文 段 从 网 络 到 达 
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一 台 主 机 时 ， 该 主机 使 用 全 部 4 个 值 来 将 报 文 段 定 向 〈 分 解 ) 到 相应 的 套 接 字 。 特 别 与 
UDP 不 同 的 是 ， 两 个 具有 不 同 源 IP 地 址 或 源 端 口号 的 到 达 TCP 报 文 段 将 被 定 加 到 两 个 不 
同 的 套 接 字 ， 除 非 TCP 报 文 段 携带 了 初始 创建 连接 的 请 求 。 为 了 深入 地 理解 这 一 点 ， 我 们 
再 来 重新 考虑 2.7.2 节 中 的 TCP 客户 - 服务 器 编程 的 例子 : 


TCP 服务 器 应 用 程序 有 一 个 “欢迎 套 接 字 ”， 它 在 12000 号 端口 上 等 待 来 自 TCP 客 
户 〈 见 图 2-27) 的 连接 建立 请 求 。 
TCP 客户 使 用 下 面 的 代码 创建 一 个 套 接 字 并 发 送 一 个 连接 建立 请 求 报 文 段 : 


clientSocket = socket(AF_INET, SOCK_STREAM) 
clientSocket.connect ((serverName, 12000) ) 


一 条 连接 建立 请 求 只 不 过 是 一 个 目的 端口 号 为 12000，TCP 首部 的 特定 “连接 建立 
位 ” 置 位 的 TCP 报 文 段 (在 3. 5 节 进 行 讨论 ) 。 这 个 报 文 段 也 包含 一 个 由 客户 选 
择 的 源 端 口号 。 

当 运行 服务 器 进程 的 计算 机 的 主机 操作 系统 接收 到 具有 目的 端口 12000 的 人 连接 
请 求 报 文 段 后 ， 它 就 定位 服务 器 进程 ， 该 进程 正在 端口 号 12000 等 待 接受 连接 。 
该 服务 器 进程 则 创建 一 个 新 的 套 接 字 : 


connectionSocket, addr = serverSocket.accept () 


该 服务 器 的 运输 层 还 注意 到 连接 请 求 报 文 段 中 的 下 列 4 个 值 : 中 该 报 文 段 中 的 源 
端口 号 ; @@ 源 主机 IP 地址 ; @ 该 报 文 段 中 的 目的 端口 号 ; 外 自身 的 卫 地址。 新 创 
建 的 连接 套 接 字 通过 这 4 个 值 来 标识 。 所 有 后 续 到 达 的 报 文 段 ， 如 果 它 们 的 源 端 
口号 、 源 主机 IP 地 址 、 目 的 端口 号 和 目的 IP 地 址 都 与 这 4 个 值 匹配 ， 则 被 分 解 到 
这 个 套 接 字 。 随 着 TCP 连接 完成 ， 客 户 和 服务 器 便 可 相互 发 送 数据 了 。 


服务 器 主机 可 以 支持 很 多 并 行 的 TCP 套 接 字 ， 每 个 套 接 字 与 一 个 进程 相 联系 ， 并 由 其 
四 元 组 来 标识 每 个 套 接 字 。 当 一 个 TCP 报 文 段 到 达 主 机 时 ， 所 有 4 个 字段 (W IP 地 址 ， 
源 端 口 ， 目 的 瑟 地 址 ， 目 的 端口 ) 被 用 来 将 报 文 段 定 向 〈 分 解 ) 到 相应 的 套 接 字 。 





端口 扫描 


我 们 已 经 看 到 一 个 服务 器 进程 潜在 地 在 一 个 打开 的 端口 等 待 远程 客户 的 接触 。 某 些 
端口 为 周知 应 用 程序 (例如 Web、FTP、DNS 和 SMTP 服务 器 ) HAG: 依照 惯例 其 他 
端口 由 流行 应 用 程序 (例如 微软 2000 SQL 服务 器 在 UDP 1434 端口 上 监听 请 求 ) 使 用 . 


因此 ， 


如 果 我 们 确定 一 台 主 机 上 打开 了 一 个 端口 ， 也 许 就 能 够 将 该 端口 映射 到 在 该 主机 


运行 的 一 个 特定 的 应 用 程序 上 。 这 对 于 系统 管理 员 非 常 有 用 ， 系 统管 理 员 通 常 希 望 知 晓 
有 什么 样 的 网 络 应 用 程序 正 运行 在 他 们 的 网 络 主机 上 。 而 攻击 者 为 了 “寻找 突破 口 ”， 
也 要 知道 在 目标 主机 上 有 哪些 端口 打开 。 如 果 发 现 一 台 主 机 正在 运行 具有 已 知 安全 缺陷 
的 应 用 程序 (例如 ， 在 端口 1434 上 监听 的 一 台 SQL 服务 器 会 遭受 缓存 溢出 ， 使 得 一 个 
远程 用 户 能 在 易 受 攻击 的 主机 上 执行 任意 代码 ， 这 是 一 种 由 Slammer 蠕虫 所 利用 的 缺陷 
[ CERT 2003-04 ] ) ， 那 么 该 主机 已 成 为 攻击 者 的 名 中 之 物 了 。 

确定 哪个 应 用 程序 正在 监听 哪些 端口 是 一 件 相对 容易 的 事情 。 事 实 上 有 许多 公共 域 
程序 ( 称 为 端口 扫描 器 ) 做 的 正 是 这 种 事情 。 也 许 它们 之 中 使 用 最 广泛 的 是 nmap， 该 程 











序 在 http ://nmap. org/ 上 免费 可 用 ， 并 且 包 括 在 大 多 数 Linux 分 发 软件 中 。 对 于 TCP，nmap 
顺序 地 扫描 端口 ， 寻 找 能 够 接受 TCP 连接 的 端口 。 对 于 UDP，nmap 也 是 顺序 地 扫描 端口 ， 
寻找 对 传输 的 UDP 报 文 段 进行 响应 的 UDP 端口 。 在 这 两 种 情况 下 ，nmap 返回 打开 的 、 关 
| 闭 的 或 不 可 达 的 端口 列表 。 运 行 nmap 的 主机 能 够 尝试 扫描 因特网 中 任何 地 方 的 目的 主机 。 
| 我 们 将 在 3.5.6 节 中 再 次 用 到 nmap， 在 该 节 中 我 们 将 讨论 TCP 连接 管理 。 









图 3-5 图 示 了 这 种 情况 ， 图 中 主机 C 向 服务 器 B 发 起 了 两 个 HTTP 会 话 ， 主 机 A 回 服 
务 器 B 发 起 了 一 个 HTTP 会 话 。 主 机 A 与 主机 C 及 服务 器 B 都 有 自己 唯一 的 人 地址, € 
们 分 别 是 A、C、B。 主 机 C 为 其 两 个 HTTP 连接 分 配 了 两 个 不 同 的 源 端 口号 (26145 和 
7532 ) 。 因 为 主机 A 选择 源 端 口号 时 与 主机 C 互 不 相干 ， 因 此 它 也 可 以 将 源 端 口号 26145 
分 配给 其 HTTP 连接 。 但 这 不 是 问题 ， 即 服务 器 B 仍然 能 够 正确 地 分 解 这 两 个 具有 相同 源 
端口 号 的 连接 ， 因 为 这 两 条 连接 有 不 同 的 源 IP 地 址 。 
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图 3-5 两 个 客户 使 用 相同 的 目的 端口 号 (80) 与 同一 个 Web 服务 器 应 用 通信 


3. Web 服务 器 与 TCP 

在 结束 这 个 讨论 之 前 ， 再 多 说 几 句 Web 服务 器 以 及 它们 如 何 使 用 端口 号 是 有 益 的 。 
考虑 一 台 运 行 Web 服务 需 的 主机 ， 例 如 在 端口 80 上 运行 一 个 Apache Web 服务 器 。 当 客户 
(如 浏览 器 ) 向 该 服务 器 发 送 报 文 段 时 ， 所 有 报 文 段 的 目的 端口 都 将 为 80。 特 别 是 ， 初 始 
连接 建立 报 文 段 和 承载 HTTP 请 求 的 报 文 段 都 有 80 的 目的 端口 。 如 我 们 刚才 描述 的 那样 ， 
AAR ai HE WS AR TER IP 地 址 和 源 端口 号 来 区 分 来 目 不 同 客户 的 报 文 段 。 

图 3-5 显示 了 一 台 Web 服务 器 为 每 条 连接 生成 一 个 新 进程 。 如 图 3-5 所 示 ， 每 个 这 样 
的 进程 都 有 自己 的 连接 套 接 字 ， 通 过 这 些 套 接 字 可 以 收 到 HTTP 请 求 和 发 送 HTTP 响应 。 


然而 ， 我 们 要 提 及 的 是 ， 连 接 套 接 字 与 进程 之 间 并 非 总 是 有 着 一 一 对 应 的 关系 。 事 实 上 ， 
当今 的 高 性 能 Web 服务 器 通常 只 使 用 一 个 进程 ,但 是 为 每 个 新 的 客户 连接 创建 一 个 具有 
新 连接 套 接 字 的 新 线程 。( 线程 可 被 看 作 是 一 个 轻 量 级 的 子 进程 ,) 如 果 做 了 第 2 章 的 第 一 
个 编程 作业 ， 你 所 构建 的 Web 服务 器 就 是 这 样 工 作 的 。 对 于 这 样 一 台 服 务 器 ， 在 任意 给 
定 的 时 间 内 都 可 能 有 “(具有 不 同 标识 的 ) 许多 连接 套 接 字 连接 到 相同 的 进程 。 

如 果 客 户 与 服务 器 使 用 持续 HTTP， 则 在 整 条 连接 持续 期 间 ， 客 户 与 服务 器 之 间 经 由 
同一 个 服务 需 套 接 字 交换 HTTP 报 文 。 然 而 ， 如 果 客 户 与 服务 需 使 用 非 持 续 HTTP， 则 对 
每 一 对 请 求 /响应 都 创建 一 个 新 的 TCP 连接 并 在 随后 关闭 ， 因 此 对 每 一 对 请 求 /响应 创建 一 
个 新 的 套 接 字 并 在 随后 关闭 。 这 种 套 接 字 的 频繁 创建 和 关闭 会 严重 地 影响 一 个 繁忙 的 Web 
服务 器 的 性 能 (尽管 有 许多 操作 系统 技巧 可 用 来 减轻 这 个 问题 的 影响 )。 读 者 对 与 持续 
和 非 持 续 HTTP 有 关 的 操作 系统 问题 感 兴趣 的 话 ， 可 参见 [Nielsen 1997, Nahum 2002 ] 。 

既然 我 们 已 经 讨论 过 了 运输 层 多 路 复 用 与 多 路 分 解 问题 ， 下 面 我 们 就 继续 讨论 因特网 
运输 层 协 议 之 一 ， 即 UDP。 在 下 一 节 中 ,我 们 将 看 到 UDP 无 非 就 是 对 网 络 层 协议 增加 了 
一 点 〈 多 路 ) 复 用 人 (多 路 ) 分 解 服务 而 已 。 


3.3 无 连接 运输 : UDP 


在 本 节 中 ， 我 们 要 仔细 地 研究 一 下 UDP， 看 它 是 怎样 工作 的 ， 能 做 些 什 么 。 我 们 鼓励 
你 回 过 来 看 一 下 2. 1 节 的 内 容 ， 其 中 包括 了 UDP 服务 模型 的 概述 ， 再 看 看 2.7. 1 节 ， 其 中 
讨论 了 UDP 上 的 套 接 字 编程 。 

为 了 激发 我 们 讨论 UDP 的 热情 ， 假 如 你 对 设计 一 个 不 提供 不 必要 服务 的 最 简化 的 运 
输 层 协议 感 兴 趣 。 你 将 打算 怎样 做 呢 ?” 你 也 许 会 首先 考虑 使 用 一 个 无 所 事 事 的 运输 层 协 
议 。 特 别 是 在 发 送 方 一 侧 ， 你 可 能 会 考虑 将 来 自 应 用 进程 的 数据 直接 交 给 网 络 层 ; 在 接收 
方 一 侧 ， 你 可 能 会 考虑 将 从 网 络 层 到 达 的 报 文 直接 交 给 应 用 进程 。 而 正如 我 们 在 前 一 节 所 
学 的 ， 我 们 必须 做 一 点 点 事 ， 而 不 是 什么 都 不 做 ! 运输 层 最 低 限 度 必须 提供 一 种 复 用 /分 
解 服务 ， 以 便 在 网 络 层 与 正确 的 应 用 级 进程 之 间 传 递 数据 。 

Hy [RFC 768] 定义 的 UDP 只 是 做 了 运输 协议 能 够 做 的 最 少 工 作 。 除 了 复 用 /分 解 功 
能 及 少量 的 差错 检测 外 ， 它 几乎 没有 对 IP 增加 别 的 东西 。 实 际 上 ， 如 果 应 用 程序 开发 人 
员 选 择 UDP 而 不 是 TCP， 则 该 应 用 程序 差不多 就 是 直接 与 IP 打交道 。UDP 从 应 用 进程 得 
到 数据 ， 附 加 上 用 于 多 路 复 用 /分 解 服务 的 源 和 目的 端口 号 字段 ， 以 及 两 个 其 他 的 小 字段 ， 
然后 将 形成 的 报 文 段 交 给 网 络 层 。 网 络 层 将 该 运输 层 报 文 段 封装 到 一 个 IP 数据 报 中 ， 然 
后 尽力 而 为 地 尝试 将 此 报 文 段 交付 给 接收 主机 。 如 果 该 报 文 段 到 达 接 收 主机 ，UDP 使 用 目 
的 端口 号 将 报 文 段 中 的 数据 交付 给 正确 的 应 用 进程 。 值 得 注意 的 是 ,使 用 UDP 时 ， 在 发 
送 报 文 段 之 前 ， 发 送 方 和 接收 方 的 运输 层 实体 之 间 没 有 握手 。 正 因为 如 此 ，UDP 被 称 为 是 
无 连接 的 。 

DNS 是 一 个 通常 使 用 UDP 的 应 用 层 协议 的 例子 。 当 一 台 主 机 中 的 DNS 应 用 程序 想 要 
进行 一 次 查询 时 ， 它 构造 了 一 个 DNS 查询 报 文 并 将 其 交 给 UDP。 无 须 执 行 任 何 与 运行 在 
目的 端 系 统 中 的 UDP 实体 之 间 的 握手 ， 主 机 端的 UDP 为 此 报 文 添加 首部 字段 ， 然 后 将 形 
成 的 报 文 段 交 给 网 络 层 。 网 络 层 将 此 UDP 报 文 段 封装 进 一 个 四 数据 报 中 ， 然 后 将 其 发 送 
给 一 个 名 字 服 务 器 。 在 查询 主机 中 的 DNS 应 用 程序 则 等 待 对 该 查询 的 响应 。 如 果 它 没有 
收 到 啊 应 〈 可 能 是 由 于 底层 网 络 丢 失 了 查询 或 啊 应 ) ， 则 要 么 试图 各 另 一 个 名 字 服 务 需 发 
送 该 查询 ， 要 么 通知 调用 的 应 用 程序 它 不 能 获得 响应 。 


现在 你 也 许 想 知 道 ， 为 什么 应 用 开发 人 员 宁 愿 在 UDP 之 上 构建 应 用 ， 而 不 选择 在 TCP 
上 构建 应 用 ? 既然 TCP 提供 了 可 靠 数据 传输 服务 ， 而 UDP 不 能 提供 ， 那 么 TCP 是 否 总 是 
首选 的 呢 ? 答案 是 否定 的 ， 因 为 有 许多 应 用 更 适合 用 UDP， 原因 主要 以 下 几 点 : 

e@ 关于 发 送 什 么 数据 以 及 何 时 发 送 的 应 用 层 控制 更 为 精细 。 采 用 UDP 时， 只 要 应 用 

进程 将 数据 传递 给 UDP，UDP 就 会 将 此 数据 打包 进 UDP 报 文 段 并 立即 将 其 传递 给 
网 络 层 。 在 另 一 方面 ，TCP 有 一 个 拥塞 控制 机 制 ， 以 便当 源 和 目的 主机 间 的 一 条 
或 多 条 链 路 变 得 极度 拥塞 时 来 遏制 运输 层 TCP 发 送 方 。TCP 仍 将 继续 重新 发 送 数 
据 报 文 段 直到 目的 主机 收 到 此 报 文 并 加 以 确认 ， 而 不 管 可 靠 交 付 需 要 用 多 长 时 间 。 
因为 实时 应 用 通常 要 求 最 小 的 发 送 速率 ,不 希望 过 分 地 延迟 报 文 段 的 传送 ， 且 能 
容忍 一 些 数据 丢失，TCP 服务 模型 并 不 是 特别 适合 这 些 应 用 的 需要 。 如 后 面 所 讨 
论 的 ， 这 些 应 用 可 以 使 用 UDP， 并 作为 应 用 的 一 部 分 来 实现 所 需 的 、 超 出 UDP 的 
不 提供 不 必要 的 报 文 段 交 付 服务 之 外 的 额外 功能 。 

e 无 须 连 接 建 立 。 如 我 们 后 面 所 讨论 的 ，TCP 在 开始 数据 传输 之 前 要 经 过 三 次 握手 。 
UDP 却 不 需要 任何 准备 即 可 进行 数据 传输 。 因 此 UDP 不 会 引入 建立 连接 的 时 延 。 
这 可 能 是 DNS 运行 在 UDP 之 上 而 不 是 运行 在 TCP 之 上 的 主要 原因 (如 果 运 行 在 
TCP E, W DNS 会 慢 得 多 ) HTTP 使 用 TCP 而 不 是 UDP， 因 为 对 于 具有 文本 数据 
的 Web 网 页 来 说 ， 可 靠 性 是 至 关 重 要 的 。 但 是 ， 如 我 们 在 2. 2 节 中 简要 讨论 的 那 
样 ，HTTP 中 的 TCP 连接 建立 时 延 对 于 与 下 载 Web 文档 相关 的 时 延 来 说 是 一 个 重 
要 因素 。 用 于 谷歌 的 Chrome 浏览 器 中 的 QUIC 协议 (快速 UDP 因特网 连接 [Iyen- 
gar 2015]) 将 UDP 作为 其 支撑 运输 协议 并 在 UDP 之 上 的 应 用 层 协 议 中 实现 可 
靠 性 。 

© 无 连接 状态 。TCP 需要 在 端 系统 中 维护 连接 状态 。 此 连接 状态 包括 接收 和 发 送 缓存 、 
拥塞 控制 参数 以 及 序号 与 确认 号 的 参数 。 我 们 将 在 3. 5 节 看 到 ， 要 实现 TCP 的 可 靠 
数据 传输 服务 并 提供 拥塞 控制 ， 这 些 状态 信息 是 必要 的 。 另 一 方面 ，UDP 不 维护 连 
接 状 态 ， 也 不 跟踪 这 些 参 数 。 因 此 ， 某 些 专 门 用 于 某 种 特定 应 用 的 服务 需 当 应 用 程 
序 运行 在 UDP 之 上 而 不 是 运行 在 TCP 上 时 ， 一 般 都 能 支持 更 多 的 活跃 客户 。 

分 组 首部 开销 小 。 每 个 TCP 报 文 段 都 有 20 字 节 的 首部 开销 ,而 UDP 仅 有 8 字 节 
的 开销 。 

图 3-6 列 出 了 流行 的 因特网 应 用 及 其 所 使 用 的 运输 协议 。 如 我 们 所 期 望 的 那样 ， 电 子 
邮件 、 远 程 终端 访问 、Web 及 文件 传输 都 运行 在 TCP 之 上 。 因 为 所 有 这 些 应 用 都 需要 TCP 
的 可 靠 数 据 传 输 服务 。 无 论 如 何 ， 有 很 多 重要 的 应 用 是 运行 在 UDP 上 而 不 是 TCP 上 。 例 
W, UDP 用 于 承载 网 络 管理 数据 (SNMP, 参见 5.7 节 )。 在 这 种 场合 下 ，UDP 要 优 于 
TCP， 因 为 网 络 管理 应 用 程序 通常 必须 在 该 网 络 处 于 重 压 状态 时 运行 ， 而 正 是 在 这 个 时 候 
可 靠 的 、 拥 塞 受 控 的 数据 传输 难以 实现 。 此 外 ， 如 我 们 前 面 所 述 ，DNS 运行 在 UDP ŻE, 
从 而 避免 了 了 TCP 的 连接 创建 时 延 。 

如 图 3-6 所 示 ，UDP 和 TCP 现在 都 用 于 多 媒体 应 用 ， 如 因特网 电话 、 实 时 视频 会 
ea a a 
用 都 能 容忍 少量 的 分 组 丢失 ， 因 此 可 靠 数 据 传 输 对 于 这 些 应 用 的 成 功 并 不 是 至 关 重 要 的 。 
此 外 ，TCP 的 拥塞 控制 会 导致 如 因特网 电话 、 视 频 会 议 之 类 的 实时 应 用 性 能 变 得 很 差 。 由 
于 这 些 原因 ， 多 媒体 应 用 开发 人 员 通 常 将 这 些 应 用 运行 在 UDP 之 上 而 不 是 TCP 之 上 。 当 
分 组 技 包 率 低 时 ， 并 且 为 了 安全 原因 ， 某 些 机构 阻 塞 UDP 流量 (参见 第 8 章 ) ， 对 于 流 式 
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媒体 传输 来 说 ，TCP 变 得 越 来 越 有 吸引 力 了 。 
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图 3-6 流行 的 因特网 应 用 及 其 下 面 的 运输 协议 


虽然 目前 通常 这 样 做 ,但 在 UDP 之 上 运行 多 媒体 应 用 是 有 争议 的 。 如 我 们 前 面 所 述 ， 
UDP 没有 拥塞 控制 。 但 是 ， 需 要 拥塞 控制 来 预防 网 络 进入 一 种 拥塞 状态 ， 在 拥塞 状态 中 可 
做 的 有 用 工作 非常 少 。 如 果 每 个 人 都 启动 流 式 高 比特 率 视频 而 不 使 用 任何 拥塞 控制 的 话 ， 
就 会 使 路 由 器 中 有 大 量 的 分 组 溢出 ， 以 至 于 非常 少 的 UDP 分 组 能 成 功 地 通过 源 到 目的 的 
路 径 传 输 。 况 且 ， 由 无 控制 的 UDP 发 送 方 引入 的 高 丢 包 率 将 引起 TCP 发 送 方 〈 如 我 们 将 
看 到 的 那样 ，TCP 遇 到 拥塞 将 减 小 它们 的 发 送 速率 ) 大 大 地 减 小 它们 的 速率 。 因 此 ，UDP 
中 缺乏 拥塞 控制 能 够 导致 UDP 发 送 方 和 接收 方 之 间 的 高 丢 包 率 ， 并 挤 垮 了 TC 会话， 这 
是 一 个 潜在 的 严重 问题 [Floyd 1999 ] 。 很 多 研究 人 员 已 提出 了 一 些 新 机 制 ， 以 促使 所 有 的 
数据 源 (包括 UDP W) 执行 自 适应 的 拥塞 控制 | Mahdavi 1997; Floyd 2000; Kohler 2006; 
RFC 4340 | 。 

在 讨论 UDP 报 文 段 结构 之 前 ， 我 们 要 提 一 下 ， 使 用 UDP 的 应 用 是 可 能 实现 可 靠 数 据 
传输 的 。 这 可 通过 在 应 用 程序 自身 中 建立 可 靠 性 机 制 来 完成 (例如 ， 可 通过 增加 确认 与 重 
传 机 制 来 实现 ， 如 采用 我 们 将 在 下 一 节 学 习 的 一 些 机 制 ) 。 我 们 前 面 讲 过 在 谷歌 的 Chrome 
浏览 器 中 所 使 用 的 QUIC 协议 [Iyengar 2015] 在 UDP 之 上 的 应 用 层 协议 中 实现 了 可 靠 性 。 
但 这 并 不 是 无 足 轻 重 的 任务 ， 它 会 使 应 用 开发 人 员 长 时 间 地 忙于 调试 。 无 论 如 何 ， 将 可 靠 
性 直接 构建 于 应 用 程序 中 可 以 使 其 “左右 着 源 ”。 也 就 是 说 应 用 进程 可 以 进行 可 靠 通信 ， 
而 无 须 受制 于 由 TCP 拥塞 控制 机 制 强加 的 传输 速率 限制 。 


3.3.1 UDP 报 文 段 结构 32 比 特 


UDP 报 文 段 结构 如 图 3-7 Pros, ERA RFC 768 EM. DS BS 
用 层 数据 占用 UDP 报 文 段 的 数据 字段 。 例 如 ， 对 于 DNS 应 
用 ,数据 字段 要 么 包含 一 个 查询 报 文 ， 要 么 包含 一 个 响应 报 三 二 
文 。 对 于 流 式 音频 应 用 ， 音 频 抽样 数据 填充 到 数据 字段 。  ”、 WAE 
UDP 首部 只 有 4 个 字段 ， 每 个 字段 由 两 个 字 节 组 成 。 如 前 一 = GE 
节 所 讨论 的 ， 通 过 端口 号 可 以 使 目的 主机 将 应 用 数据 交 给 运 
行 在 目的 端 系统 中 的 相应 进程 〈 即 执行 分 解 功能 ) 。 长 度 字段 E37 UDP RBG 
指示 了 在 UDP 报 文 段 中 的 字 节 数 (首部 加 数据 ) 。 因 为 数据 字段 的 长 度 在 一 个 UDP 段 中 
不 同 于 在 另 一 个 段 中 ， 故 需要 一 个 明确 的 长 度 。 接 收 方 使 用 检验 和 来 检查 在 该 报 文 段 中 是 





否 出 现 了 差错 。 实 际 上 ， 计算 检验 和 时 ， 除 了 UDP 报 文 段 以 外 还 包括 了 IP 首部 的 一 些 字 
段 。 但 是 我 们 忽略 这 些 细节 ， 以 便 能 从 整体 上 看 问题 。 下 面 我 们 将 讨论 检验 和 的 计算 。 在 
6.2 节 中 将 描述 差错 检测 的 基本 原理 。 长 度 字 段 指 明了 包括 首部 在 内 的 UDP 报 文 段 长 度 
( 以 字 市 为 单位 )。 

3. 3.2 UDP 检验 和 


UDP 检验 和 提供 了 差错 检测 功能 。 这 就 是 说 ， 检 验 和 用 于 确定 当 UDP 报 文 段 从 源 到 
达 目 的 地 移动 时 ， 其 中 的 比特 是 否 发 生 了 改变 (例如 ， 由 于 链 路 中 的 噪声 干扰 或 者 存储 在 
路 由 器 中 时 引入 问题 ) 。 发 送 方 的 UDP 对 报 文 段 中 的 所 有 16 比特 字 的 和 进行 反 码 运算 ， 
求 和 时 遇 到 的 任何 溢出 都 被 回 卷 。 得 到 的 结果 被 放 在 UDP 报 文 段 中 的 检验 和 字段 。 下 面 
给 出 一 个 计算 检验 和 的 简单 例子 。 在 RFC 1071 中 可 以 找到 有 效 实 现 的 细节 ， 还 可 在 
[ Stone 1998; Stone 2000] 中 找到 它 处 理 真 实数 据 的 性 能 。 举 例 来 说 ， 假 定 我 们 有 下 面 3 
个 16 比特 的 字 : 
0110011001100000 
0101010101010101 
1000111100001100 
这 些 16 比特 字 的 前 两 个 之 和 是 : 
0110011001100000 
0101010101010101 


1011101110110101 
再 将 上 面 的 和 与 第 三 个 字 相 加 ， 得 出 : 
1011101110110101 
1000111100001100 
0100101011000010 
注意 到 最 后 一 次 加 法 有 洲 出 ， 它 要 被 回 卷 。 反 人 码 运 算 就 是 将 所 有 的 0 换 成 1， 所 有 的 
| 转换 成 0。 因 此 ， 该 和 0100101011000010 的 反 码 运算 结果 是 1011010100111101， 这 就 变 
为 了 检验 和 。 在 接收 方 ， 全 部 的 4 个 16 比特 字 (包括 检验 和 ) 加 在 一 起 。 如 果 该 分 组 中 
没有 引入 差错 ， 则 显然 在 接收 方 处 该 和 将 是 1111111111111111。 如 果 这 些 比 特 之 一 是 0， 
那么 我 们 就 知道 该 分 组 中 已 经 出 现 了 差错 。 
你 可 能 想 知 道 为 什么 UDP 首先 提供 了 检验 和 ， 就 像 许 多 链 路 层 协议 (包括 流行 的 以 
太 网 协议 ) 也 提供 了 差错 检测 那样 。 其 原因 是 不 能 保证 源 和 目的 之 间 的 所 有 链 路 都 提供 差 
错 检测 ; 这 就 是 说 ， 也 许 这 些 链 路 中 的 一 条 可 能 使 用 没有 差错 检测 的 协议 。 此 外 ， 即 使 报 
文 段 经 链 路 正确 地 传输 ， 当 报 文 段 人 存储 在 某 台 路 由 需 的 内 存 中 时 ， 也 可 能 引入 比特 差错 。 
在 既 无 法 确保 逐 链 路 的 可 靠 性 ， 又 无 法 确保 内 存 中 的 差错 检测 的 情况 下 ， 如 果 端 到 端 数据 
传输 服务 要 提供 差错 检测 UDP 就 必须 在 端 到 端 基础 上 在 运输 层 提供 差错 检测 。 这 是 一 个 
在 系统 设计 中 被 称颂 的 端 到 端 原则 (end-end principle) 的 例子 | Saltzer 1984 ] ， 该 原则 表 
述 为 因为 某 种 功能 〈 在 此 时 为 差错 检测 ) 必须 基于 端 到 端 实现 : “与 在 较 高 级 别提 供 这 些 
功能 的 代价 相 比 ， 在 较 低 级 别 上 设置 的 功能 可 能 是 元 余 的 或 几乎 没有 价值 的 。 
因为 假定 IP 是 可 以 运行 在 任何 第 二 层 协 议 之 上 的 ， 运 输 层 提供 差错 检测 作为 一 种 保 
险 措 施 是 非常 有 用 的 。 虽 然 UDP 提供 差错 检测 ， 但 它 对 差错 恢复 无 能 为 力 。UDP 的 某 种 
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实现 只 是 丢弃 受 损 的 报 文 段 ; 其 他 实现 是 将 受 损 的 报 文 段 交 给 应 用 程序 并 给 出 警告 。 

至 此 结束 了 关于 UDP 的 讨论 。 我 们 将 很 快 看 到 TCP 为 应 用 提供 了 可 靠 数 据 传输 及 
UDP 所 不 能 提供 的 其 他 服务 。TCP 自然 要 比 UDP 复杂 得 多 。 然 而 ， 在 讨论 TCP 之 前 ,我 
们 后 退 一 步 ， 先 来 讨论 一 下 可 靠 数据 传输 的 基本 原理 是 有 用 的 。 


3.4 可 靠 数 据 传输 原理 


在 本 节 中 ， 我 们 在 一 般 场 景 下 考虑 可 靠 数据 传输 的 问题 。 因 为 可 靠 数据 传输 的 实现 问 
题 不 仅 在 运输 层 出 现 ， 也 会 在 链 路 层 以 及 应 用 层 出 现 ， 这 时 讨论 它 是 恰当 的 。 因 此 ， 一 般 
性 问题 对 网 络 来 说 更 为 重要 。 如 果 的 确 要 将 所 有 网 络 中 最 为 重要 的 “前 10 个 ”问题 排名 
的 话 ， 可 靠 数 据 传输 将 是 名 列 榜首 的 候选 者 。 在 下 一 节 中 ， 我们 将 学 习 TCP， 尤 其 要 说 明 
TCP 所 采用 的 许多 原理 ， 而 这 些 正 是 我 们 打算 描述 的 内 容 。 

图 3-8 图 示 说 明了 我 们 学 习 可 靠 数 据 传输 的 框架 。 为 上 层 实 体 提 供 的 服务 抽象 是 : 数 
据 可 以 通过 一 条 可 靠 的 信道 进行 传输 。 借 助 于 可 靠 信 道 ， 传 输 数 据 比 特 就 不 会 受到 损坏 
(由 0 变 为 1, 或 者 相反 ) 或 丢失 ， 而 且 所 有 数据 都 是 按照 其 发 送 顺序 进行 交付 。 这 恰好 
就 是 TCP 回调 用 它 的 因特网 应 用 所 提供 的 服务 模型 。 
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图 3-8 ”可靠 数据 传输 : 服务 模型 与 服务 实现 


实现 这 种 服务 抽象 是 可 靠 数 据 传输 协议 (reliable data transfer protocol) 的 责任 。 由 于 
可 靠 数据 传输 协议 的 下 层 协议 也 许 是 不 可 靠 的 ， 因 此 这 是 一 项 困难 的 任务 。 例 如 ，TCP 是 
在 不 可 靠 的 (IP) 端 到 端 网 络 层 之 上 实现 的 可 靠 数 据 传输 协议 。 更 一 般 的 情况 是 ， 两 个 可 
靠 通信 端点 的 下 层 可 能 是 由 一 条 物理 链 路 (如 在 链 路 级 数据 传输 协议 的 场合 下 ) 组 成 或 是 
由 一 个 全 球 互联 网 络 (如 在 运输 级 协议 的 场合 下 ) 组 成 。 然 而 ， 就 我 们 的 目的 而 言 ， 我 们 


可 将 较 低 层 直 接 视 为 不 可 靠 的 点 对 点 信道 。 

在 本 节 中 ,考虑 到 底层 信道 模型 越 来 越 复杂 ， 我 们 将 不 断 地 开发 一 个 可 靠 数 据 传输 协 
议 的 发 送 方 一 侧 和 接收 方 一 侧 。 例 如 ， 我 们 将 考虑 当 底层 信道 能 够 损坏 比特 或 丢失 整个 分 
组 时 ， 需 要 什么 样 的 协议 机 制 。 这 里 贯穿 我 们 讨论 始终 的 一 个 假设 是 分 组 将 以 它们 发 送 的 
次 序 进 行 交 付 ， 某 些 分 组 可 能 会 丢失 ; 这 就 是 说 ， 底 层 信道 将 不 会 对 分 组 重 排序 。 图 3-8b 
图 示 说 明了 用 于 数据 传输 协议 的 接口 。 通 过 调用 rdt_send() 水 数 ， 上 层 可 以 调用 数据 传输 
协议 的 发 送 方 。 它 将 要 发 送 的 数据 交付 给 位 于 接收 方 的 较 高 层 。( 这 里 rdt 表示 可 人 靠 数据 传 
输 协议 ，_send 指示 rdt 的 发 送 端正 在 被 调用 。 开 发 任何 协议 的 第 一 步 就 是 要 选择 一 个 好 的 
AF!) 在 接收 端 ， 当 分 组 从 信道 的 接收 端 到 达 时 ， 将 调用 rdt_rev() 。 当 rdt 协议 想 要 回 较 
高 层 交 付 数据 时 ， 将 通过 调用 deliver_data() 来 完成 。 后 面 ， 我 们 将 使 用 术语 “分 组 ”而 不 
用 运输 层 的 “ 报 文 段 ” 。 因 为 本 节 研 讨 的 理论 适用 于 一 般 的 计算 机 网 络 ， 而 不 只 是 用 于 因 
特 网 运输 层 ， 所 以 这 时 采用 通用 术语 “分 组 ”也 许 更 为 合适 。 

在 本 节 中 ， 我 们 仅 考 虑 单 向 数据 传输 (unidirectional data transfer) 的 情况 ， 即 数据 传 
输 是 从 发 送 端 到 接收 端的 。 可 靠 的 双向 数据 传输 (bidirectional data transfer) ( 即 全 双 工 数 
据 传输 ) 情况 从 概念 上 讲 不 会 更 难 ， 但 解释 起 来 更 为 单调 乏味 。 虽 然 我 们 只 考虑 单 问 数据 
传输 ， 注 意 到 下 列 事实 是 重要 的 ， 我 们 的 协议 也 需要 在 发 送 端 和 接收 端 两 个 方向 上 传输 分 
组 ， 如 图 3-8 所 示 。 我 们 很 快 会 看 到 ， 除 了 交换 含有 竺 传送 的 数据 的 分 组 之 外 ，rdt 的 发 送 
端 和 接收 端 还 需 往返 交换 控制 分 组 。rdt 的 发 送 端 和 接收 端 都 要 通过 调用 udt_send() 发 送 分 
组 给 对 方 ( 其 中 udt 表示 不 可 人 靠 数 据 传输 )。 


3.4.1 构造 可 靠 数 据 传输 协议 

我 们 现在 一 步 步 地 研究 一 系列 协议 ， 它 们 一 个 比 一 个 更 为 复杂 ， 最 后 得 到 一 个 完美 、 
可 靠 的 数据 传输 协议 。 

1. 经 完全 可 靠 信道 的 可 靠 数 据 传 输 : rdt1. 0 


首先 ， 我 们 考虑 最 简单 的 情况 ， 即 底层 信道 是 完全 可 靠 的 。 我 们 称 该 协议 为 rdt1. 0, 
该 协议 本 身 是 简单 的 。 图 3-9 显示 了 rdtl.0 发 送 方 和 接收 方 的 有 限 状 态 机 (Finite- State 
Machine, FSM) 的 定义 。 图 3-9a 中 的 FSM ws 


定义 了 发 送 方 的 操作 ， 图 3-9b 中 的 FSM 定 `a rdt_send (data) 
义 了 接收 方 的 操作 。 注 意 到 下 列 问题 是 重要 等 待 来 自 Ja 
的 ， 发 送 方 和 接收 方 有 各 自 的 FSM。 图 3-9 ai igi udt_send (packet) 


中 发 送 方 和 接收 方 的 FSM 每 个 都 只 有 一 个 状 
态 。FSM 描述 图 中 的 箭头 指示 了 协议 从 一 个 
状态 变迁 到 另 一 个 状态 。( 因为 图 3-9 中 的 每 ` ai 
个 FSM 都 只 有 一 个 状态 ， 因 此 变迁 必定 是 从 二 二 


a) rdt1.0: RIAN 


extract (packet, data) 


一 个 状态 返回 到 目 身 ; 我 们 很 快 将 看 到 更 复 下 层 的 调用 re AF en 
杂 的 状态 图 .) 引起 变迁 的 事件 显示 在 表示 
变迁 的 横 线 上 方 ， 事件 发 生 时 所 采取 的 动作 b) rdt1.0: 接收 端 


显示 在 横 线 下 方 。 如 果 对 一 个 事件 没有 动作 ， 图 3-9 rdtl.O; 用 于 完全 可 靠 信 道 的 协议 
或 没有 就 事件 发 生 而 采取 了 一 个 动作 ， 我 们 
将 在 横 线 上 方 或 下 方 使 用 符号 和 A， 以 分 别 明确 地 表示 缺少 动作 或 事件 。FSM 的 初始 状态 用 
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虚线 表示 。 尽 管 图 3-9 中 的 FSM 只 有 一 个 状态 ,但 马上 我 们 就 将 看 到 多 状态 的 FSM， 因 此 
标识 每 个 FSM 的 初始 状态 是 非常 重要 的 。 

rdt AY) Aci thm et rdt_send( data) 事 件 接 受 来 自 较 高 层 的 数据 ， 产 生 一 个 包含 该 数据 
的 分 组 (经 由 make_pkt(data) 动作) ， 并 将 分 组 发 送 到 信和 道中。 实际 上 ，rdt_send( data) 事 
件 是 由 较 高 层 应 用 的 过 程 调用 产生 的 (例如 ，rdt_send() ) 。 

在 接收 端 ，rdt 通过 rdt_rev( packet) 事件 从 底层 信道 接收 一 个 分 组 ， 从 分 组 中 取出 数据 
(经 由 extract( packet, data) 动作 ) ， 并 将 数据 上 传 给 较 高 层 (通过 deliver_data( data) 动作 ) 。 
实际 上 ，rdt_rcv( packet) 事件 是 由 较 低层 协议 的 过 程 调用 产生 的 (例如 ，rdt_rev() ) 。 

在 这 个 简单 的 协议 中 ， 一 个 单元 数据 与 一 个 分 组 没 差别 。 而 且 ， 所 有 分 组 是 从 发 送 方 
流 疝 接收 方 ;， 有 了 完全 可 靠 的 信道 ， 接 收 端 就 不 需要 提供 任何 反馈 信息 给 发 送 方 ， 因 为 不 
必 担 心 出 现 差错 ! 注意 到 我 们 也 已 经 假定 了 接收 方 接收 数据 的 速率 能 够 与 发 送 方 发 送 数据 
的 速率 一 样 快 。 因 此 ， 接 收 方 没 有 必要 请 求 发 送 方 慢 一 点 ! 

2. 经 具有 比特 差错 信道 的 可 靠 数 据 传输 : rdt2.0 

底层 信道 更 为 实际 的 模型 是 分 组 中 的 比特 可 能 受 损 的 模型 。 在 分 组 的 传输 、 传 播 或 组 
存 的 过 程 中 ， 这 种 比特 差错 通常 会 出 现在 网 络 的 物理 部 件 中 。 我 们 眼下 还 将 继续 假定 所 有 
发 送 的 分 组 (虽然 有 些 比特 可 能 受 损 ) 将 按 其 发 送 的 顺序 被 接收 。 

在 研发 一 种 经 这 种 信道 进行 可 靠 通信 的 协议 之 前 ， 首 先 考虑 一 下 人 们 会 怎样 处 理 这 类 
情形 。 考 虑 一 下 你 自己 是 怎样 通过 电话 口述 一 条 长 报 文 的 。 在 通常 情况 下 ， 报 文 接收 者 在 
听 到 、 理 解 并 记 下 每 句 话 后 可 能 会 说 “OK”。 如 果 报 文 接收 者 听 到 一 句 含 糊 不 清 的 话 时 ， 
他 可 能 要 求 你 重复 那 句 容易 误解 的 话 。 这 种 口述 报 文 协议 使 用 了 肯定 确认 (positive ac- 
knowledgment) (“OK”) 与 否定 确认 (negative acknowledgment) (“请 重复 一 遍 ”)。 这 些 
控制 报 文 使 得 接收 方 可 以 让 发 送 方 知道 哪些 内 容 被 正确 接收 ， 哪 些 内 容 接 收 有 误 并 因此 需 
要 重复 。 在 计算 机 网 络 环境 中 ， 基 于 这 样 重 传 机 制 的 可 靠 数 据 传 输 协议 称 为 自动 重 传 请 求 
( Automatic Repeat reQuest, ARQ) 协议 。 

重要 的 是 ，ARQ 协议 中 还 需要 另外 三 种 协议 功能 来 处 理 存在 比特 差错 的 情况 : 

© 差错 检测 。 首 先 ， 需要 一 种 机 制 以 使 接收 方 检测 到 何 时 出 现 了 比特 差错 。 前 一 节 

HE, UDP 使 用 因特网 检验 和 字段 正 是 为 了 这 个 目的 。 在 第 5 章 中 ,我 们 将 更 详 
细 地 学 习 差 错 检 测 和 纠 错 技 术 。 这 些 技术 使 接收 方 可 以 检测 并 可 能 纠正 分 组 中 的 
比特 差错 。 此 刻 ， 我 们 只 需 知 道 这 些 技术 要 求 有 额外 的 比特 〈 除 了 竺 发送 的 初始 
数据 比特 之 外 的 比特 ) 从 发 送 方 发 送 到 接收 方 ; 这 些 比特 将 被 汇集 在 rdt2. 0 数据 
分 组 的 分 组 检验 和 字段 中 。 

e 接收 方 反 馈 。 因 为 发 送 方 和 接收 方 通常 在 不 同 端 系 统 上 执行 ， 可 能 相 隅 数 千 英 里 ， 
发 送 方 要 了 解 接收 方 情况 〈 此 时 为 分 组 是 否 被 正确 接收 ) 的 唯一 途径 就 是 让 接收 
方 提 供 明确 的 反馈 信息 给 发 送 方 。 在 口述 报 文 情况 下 回答 的 “肯定 确认 ”(ACK ) 
和 “否定 确认 ”(NAK) 就 是 这 种 反馈 的 例子 。 类 似 地 ， 我 们 的 rdt2. 0 协议 将 从 
接收 方向 发 送 方 回 送 ACK 与 NAK 分 组 。 理 论 上 ， 这 些 分 组 只 需要 一 个 比特 长 ; 
如 用 0 KR NAK, 用 1 表示 ACK, 

o 重 传 。 接 收 方 收 到 有 差错 的 分 组 时 ， 发 送 方 将 重 传 该 分 组 文 。 

图 3-10 说 明了 表示 rdt2.0 的 FSM， 该 数据 传输 协议 采用 了 差错 检测 、 肯 定 确认 与 否 
定 确认 。 


i 
车 
J 


137 


rdt_send (data) 


sndpkt=make_pkt (data, checksum) 
udt_send (sndpkt) 


rdt_rev(rcevpkt) && isNAK (rcvpkt) 


上 层 的 调用 或 NAK udt_send (sndpkt) 


rdt_rcv(rcevpkt) && isACK (rcvpkt) 
A 


a) rdt2.0: 发 送 端 


rdt_rev(rcvpkt) && corrupt (recvpkt) 


sndpkt=make_pkt (NAK) 
Se udt_send(sndpkt) 
~ 


(1 


rdt_rcev(rcvpkt) && notcorrupt (rcvpkt) 


extract (rcvpkt, data) 
deliver_data (data) 
sndpkt=make_pkt (ACK) 
udt_send(sndpkt) 


b) rdt2.0: 接收 端 
图 3-10 = rdt2.0; 用 于 具有 比特 差错 信道 的 协议 


rdt2.0 的 发 送 端 有 两 个 状态 。 在 最 左边 的 状态 中 ， 发 送 端 协议 正 等 待 来 自 上 层 传 下 来 
的 数据 。 当 rdt_send( data) 事 件 出 现时 ， 发 送 方 将 产生 一 个 包含 待 发 送 数 据 的 分 组 (sndp- 
kt) ， 带 有 检验 和 例如， 就 像 在 3.3.2 节 讨 论 的 对 UDP 报 文 段 使 用 的 方法 ) ， 然 后 经 由 
udt_send( sndpkt) 操作 发 送 该 分 组 。 在 最 右边 的 状态 中 ， 发 送 方 协议 等 待 来 自 接收 方 的 
ACK 或 NAK 分 组 。 如 果 收 到 一 个 ACK 分 组 (图 3- 10 中 符号 rdt_rev(revpkt) && isACK 
(revpkt) 对 应 该 事件 ) ， 则 发 送 方 知道 最 近 发 送 的 分 组 已 被 正确 接收 ， 因 此 协议 返回 到 等 
待 来 自 上 层 的 数据 的 状态 。 如 果 收 到 一 个 NAK 分 组 ， 该 协议 重 传 上 一 个 分 组 并 等 待 接收 
方 为 响应 重 传 分 组 而 回 送 的 ACK 和 NAK。 注 意 到 下 列 事实 很 重要 : 当 发 送 方 处 于 等 待 
ACK 或 NAK 的 状态 时 ， 它 不 能 从 上 层 获 得 更 多 的 数据 ; 这 就 是 说 ，rdt_send() 事 件 不 可 能 
出 现 ; 仅 当 接收 到 ACK 并 离开 该 状态 时 才能 发 生 这 样 的 事件 。 因 此 ， 发 送 方 将 不 会 发 送 
一 块 新 数据 ， 除 非 发 送 方 确信 接收 方 已 正确 接收 当前 分 组 。 由 于 这 种 行为 ，rdt2.0 这 样 的 
协议 被 称 为 停 等 〈stop-and- wait) 协议 。 

rdt2. 0 接收 方 的 FSM 仍然 只 有 单一 状态 。 当 分 组 到 达 时 ， 接 收 方 要 么 回答 一 个 ACK， 要 
么 回答 一 个 NAK， 这 取决 于 收 到 的 分 组 是 否 受 损 。 在 图 3-10 中 ， 符 号 rdt_rcv(rcvpkt) && 
corrupt( revpkt) 对 应 于 收 到 一 个 分 组 并 发 现 有 错 的 事件 。 
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rdt2. 0 协议 看 起 来 似乎 可 以 运行 了 ,但 遗憾 的 是 ， 它 存在 一 个 致命 的 缺陷 。 尤 其 是 我 
们 没有 考虑 到 ACK 或 NAK 分 组 受 损 的 可 能 性 ! (在 继续 人 研究 之 前 ， 你 应 该 考虑 怎样 解决 
该 问题 。) 遗憾 的 是 ， 我 们 细小 的 疏忽 并 非 像 它 看 起 来 那么 无 关 紧 要 。 至 少 ， 我 们 需要 在 
ACK/NAK 分 组 中 添加 检验 和 比特 以 检测 这 样 的 差错 。 更 难 的 问题 是 协议 应 该 怎样 纠正 
ACK 或 NAK 分 组 中 的 差错 。 这 里 的 难点 在 于 ， 如 果 一 个 ACK 或 NAK 分 组 受 损 ， 发 送 方 
无 法 知道 接收 方 是 否 正 确 接 收 了 上 一 块 发 送 的 数据 。 

考虑 处 理 受 损 ACK 和 NAK 时 的 3 种 可 能 性 : 

e 对 于 第 一 种 可 能 性 ， 考 虑 在 口述 报 文 情况 下 人 可 能 的 做 法 。 如 果 说 话 者 不 理解 来 
自 接收 方 回答 的 “OK” 或 “请 重复 一 忆 ”， 说 话 者 将 可 能 问 “ 你 说 什么 ?” (因此 
在 我 们 的 协议 中 引入 了 一 种 新 型 发 送 方 到 接收 方 的 分 组 ) 。 接 收 方 则 将 复述 其 回 
答 。 但 是 如 果 说 话 者 的 “你 说 什么 ?” 产 生 了 差错 ， 情 况 又 会 怎样 呢 ? 接收 者 不 明 
日 那 名 混淆 的 话 是 口述 内 容 的 一 部 分 还 是 一 个 要 求 重 复 上 次 回答 的 请 求 ， 很 可 能 
回 一 名 “你 说 什么 ?”。 于 是 ， 该 回答 可 能 含糊 不 清 了 。 显 然 ， 我 们 走 上 了 一 条 困 
难 重重 之 路 。 

e 第 二 种 可 能 性 是 增加 足够 的 检验 和 比特 ， 使 发 送 方 不 仅 可 以 检测 差错 ， ENRE 
差错 。 对 于 会 产生 差错 但 不 丢失 分 组 的 信道 ， 这 就 可 以 直接 解决 问题 。 

。 第 三 种 方法 是 ， 当 发 送 方 收 到 含糊 不 清 的 ACK 或 NAK 分 组 时 ， 只 需 重 传 当 前 数 
据 分 组 即 可 。 然 而 ， 这 种 方法 在 发 送 方 到 接收 方 的 信道 中 引入 了 宛 余 分 组 ( dupli- 
cate packet) 。 宛 余 分 组 的 根本 困难 在 于 接收 方 不 知道 它 上 次 所 发 送 的 ACK 或 NAK 
是 否 被 发 送 方正 确 地 收 到 。 因 此 它 无 法 事先 知道 接收 到 的 分 组 是 新 的 还 是 一 次 
重 传 ! 

解决 这 个 新 问题 的 一 个 简单 方法 (几乎 所 有 现 有 的 数据 传输 协议 中 ， 包 括 TCP， 都 采 
用 了 这 种 方法 ) 是 在 数据 分 组 中 添加 一 新 字段 ， 让 发 送 方 对 其 数据 分 组 编号 ， 即 将 发 送 数 
据 分 组 的 序号 (sequence number) 放 在 该 字段 。 于 是 ， 接 收 方 只 需要 检查 序号 即 可 确定 收 
到 的 分 组 是 否 一 次 重 传 。 对 于 停 等 协议 这 种 简单 情况 ，1 比特 序号 就 足够 了 ， 因 为 它 可 让 
接收 方 知道 发 送 方 是 否 正 在 重 传 前 一 个 发 送 分 组 (接收 到 的 分 组 序号 与 最 近 收 到 的 分 组 序 
号 相同 ) ,或 是 一 个 新 分 组 (序号 变化 了 ， 用 模 2 运算 “前 向 ”移动 )。 因 为 目前 我 们 假 
定 信道 不 丢 分 组 ，ACK 和 NAK 分 组 本 身 不 需要 指明 它们 要 确认 的 分 组 序号 。 发 送 方 知道 
所 接收 到 的 ACK 和 NAK 分 组 (无论 是 否 是 含糊 不 清 的 ) 是 为 啊 应 其 最 近 发 送 的 数据 分 组 
而 生成 的 。 

图 3-11 和 图 3-12 给 出 了 对 rdt2. 1 的 FSM 描述 ， 这 是 rdt2.0 的 修订 版 。rdt2. 1 的 发 送 
方 和 接收 方 FSM 的 状态 数 都 是 以 前 的 两 倍 。 这 是 因为 协议 状态 此 时 必须 反映 出 目前 (由 
发 送 方 ) 正 发 送 的 分 组 或 (在 接收 方 ) 希望 接收 的 分 组 的 序号 是 0 还 是 1。 值 得 注意 的 
是 ,发 送 或 期 望 接收 0 号 分 组 的 状态 中 的 动作 与 发 送 或 期 望 接收 1 号 分 组 的 状态 中 的 动作 
是 相似 的 ; 唯一 的 不 同 是 序号 处 理 的 方法 不 同 。 

协议 rdt2. 1 使 用 了 从 接收 方 到 发 送 方 的 肯定 确认 和 和 否定 确认 。 当 接收 到 失 序 的 分 组 
时 ， 接 收 方 对 所 接收 的 分 组 发 送 一 个 肯定 确认 。 如 果 收 到 受 损 的 分 组 ， 则 接收 方 将 发 送 一 
个 否定 确认 。 如 果 不 发 送 NAK， 而 是 对 上 次 正确 接收 的 分 组 发 送 一 个 ACK， 我 们 也 能 实 
现 与 NAK 一 样 的 效果 。 发 送 方 接收 到 对 同一 个 分 组 的 两 个 ACK ( 即 接收 元 余 ACK 
(duplicate ACK)) 后 ， 就 知道 接收 方 没 有 正确 接收 到 跟 在 被 确认 两 次 的 分 组 后 面 的 分 组 。 
rdt2. 2 是 在 有 比特 差错 信道 上 实现 的 一 个 无 NAK 的 可 靠 数 据 传输 协议 ， 如 图 3-13 和 
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图 3-14 所 示 。rdt2. 1 和 rdt2.2 之 间 的 细微 变化 在 于 ， 接 收 方 此 时 必须 包括 由 一 个 ACK 报 
文 所 确认 的 分 组 序号 (这 可 以 通过 在 接收 方 FSM 中 ， 在 make_pkt() 中 包括 参数 ACK 0 或 
ACK 1 来 实现 ) ， 发 送 方 此 时 必须 检查 接收 到 的 ACK 报 文中 被 确认 的 分 组 序号 (这 可 通过 
在 发 送 方 FSM 中 , 在 isACK() 中 包括 参数 0 或 1 来 实现 ) 。 


rdt_send (data) 


sndpkt=make_pkt (0, data, checksum) 
udt_send (sndpkt) 


rdt_rcv(rcvpkt) && 
Tg (corrupt (revpkt) | | 
N 


"S isNAK (rcvpkt) ) 
i Sh 等 待 ACK ; udt_send (sndpkt) 
roi 或 NAK 0 
rdt_rcv(rcvpkt) rdt_rcv (rcvpkt) 
&& notcorrupt (revpkt) && notcorrupt (rcvpkt) 
&& isACK (rcvpkt) && isACK (rcvpkt) 
A A 


等 待 ACK 
或 NAK 1 AAR 


rdt_rcv (rcvpkt)&&á 
(corrupt (rcvpkt) | | 
isNAK (rcvpkt) ) 


$ 


udt_send (sndpkt) rdt_send (data) 


sndpkt=make_pkt (1,data,checksum) 
udt_send (sndpkt) 


2] 3-11 rdt2. 1 发 送 方 


rdt_rcv(rcvpkt) && notcorrupt (rcvpkt) 
&& has_seq0 (rcvpkt) 


extract (rcvpkt, data) 
deliver_data (data) 
sndpkt=make_pkt (ACK, checksum) 
d d dpkt 
rdt_rev(rcvpkt) BOS BENE YERCE CE) 


= x rdt_rcv(revpkt) && corrupt (rcvpkt) 
&& corrupt (rcvpkt) \ 
ey sndpkt=make_pkt (NAK, checksum) 
sndpkt=make_pkt (NAK, checksum) iy udt_send (sndpkt) 
udt_send (sndpkt) ey 
等 待 来 自 等 待 来 自 , 


rdt_rcv(rcvpkt) && notcorrupt 下 层 的 0 下 层 的 1 


ini <i cil: hi i seql (rcvpkt) 


rdt_rcv(revpkt) && notcorrupt 

rcvpkt) &&has_seq0 (rcvpkt) 
sndpkt=make_pkt (ACK, checksum checksum) sndpkt=make_pkt (ACK, checksum) 
udt_send (sndpkt) udt_send (sndpkt) 


rdt_rcv (rcvpkt) && notcorrupt (rcvpkt) 
&& has_seql] (rcvpkt) 


extract (rcvpkt, data) 
deliver_data (data) 
sndpkt=make_pkt (ACK, checksum) 
udt_send (sndpkt) 


图 3-12 rdt2. 1 接收 方 
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rdt_send (data) 


sndpkt=make_pkt (0,data, checksum) 


udt_send (sndpkt) 


~ 
等 待 来 自 
ACK 0 
调用 0 
rdt_rcv (rcvpkt) 
&& notcorrupt (rcvpkt) 
&& isACK (rcvpkt,1) 
A 
k 等 待 来 自 
等 待 ACK 1 


rdt_rcev(revpkt) && 
(corrupt (revpkt) | | 
isACK (rcevpkt, 0) ) 


We 


udt_send (sndpkt) rdt_send (data) 


sndpkt=make_pkt (1,data,checksum) 


udt_send (sndpkt) 


图 3-13 rdt2.2 发 送 方 


rdt_rcv (revpkt) && notcorrupt (rcvpkt) 
&& has_seq0O (rcvpkt) 


extract (rcvpkt, data) 
deliver_data (data) 
sndpkt=make_pkt (ACK, 0, checksum) 
udt_send (sndpkt) 


N 
‘N 
> 
、 
J 
和 
全 ry 


rdt_rcv(rcvpkt) && 
(corrupt (rcvpkt) | | 
has_seql (rcvpkt) ) 





sndpkt=make_pkt (ACK, 1, checksum) 
udt_send(sndpkt) 


rdt_rev(rcevpkt) && notcorrupt (rcvpkt) 


&& has_seql (rcvpkt) 


extract (rcvpkt, data) 
deliver_data (data) 
sndpkt=make_pkt (ACK, 1, checksum) 
udt_send(sndpkt) 


图 3-14 rd2. 2 接收 方 
3. 经 具有 比特 差错 的 丢 包 信道 的 可 靠 数 据 传输 : rdt3. 0 


上 层 的 调用 1 


rdt_rcv(rcvpkt) && 
(corrupt (rcevpkt) | | 
isACK (rcvpkt,1)) 


udt_send(sndpkt) 


rdt_rcv(rcevpkt) 
&& notcorrupt (rcvpkt) 
&& isACK (rcvpkt, 0) 


A 


rdt_rcv(rcvpkt) && 
(corrupt (rcvpkt) | | 
has_seq0 (rcevpkt) ) 


sndpkt=make_pkt (ACK, 0, checksum) 
udt_send (sndpkt) 


等 待 来 自 
下 展 的 1 


现在 假定 除了 比特 受 损 外 ， 底 层 信 道 还 会 丢 包 ， 这 在 今天 的 计算 机 网 络 〈 包 括 因 特 
网 ) 中 并 不 罕见 。 协 议 现在 必须 处 理 另 外 两 个 关注 的 问题 : 怎样 检测 丢 包 以 及 发 生 丢 包 后 
该 做 些 人 什么。 在 rdt2. 2 中 已 经 研发 的 技术 ， 如 使 用 检验 和 、 序 号 、ACK 分 组 和 重 传 等 ， 使 
我 们 能 给 出 后 一 个 问题 的 答案 。 为 解决 第 一 个 关注 的 问题 ， 还 需 增 加 一 种 新 的 协议 机 制 。 

有 很 多 可 能 的 方法 用 于 解决 丢 包 问题 〈 在 本 章 结 尾 的 习题 中 研究 了 几 种 其 他 方法 ) 。 


这 里 ， 我 们 让 发 送 方 负责 检测 和 恢复 丢 包 工作 。 假 定 发 送 方 传输 一 个 数据 分 组 ， 该 分 组 或 
者 接收 方 对 该 分 组 的 ACK 发 生 了 丢失 。 在 这 两 种 情况 下 ， 发 送 方 都 收 不 到 应 当 到 来 的 接 
收 方 的 响应 。 如 果 发 送 方 愿意 等 待 足够 长 的 时 间 以 便 确定 分 组 已 丢失 ， 则 它 只 需 重 传 该 数 
据 分 组 即 可 。 你 应 该 相信 该 协议 确实 有 效 。 

但 是 发 送 方 需要 等 待 多 久 才 能 确定 已 丢失 了 某 些 东西 呢 ?” 很 明显 发 送 方 至 少 需 要 等 待 
这 样 长 的 时 间 : 即 发 送 方 与 接收 方 之 间 的 一 个 往返 时 延 〈 可 能 会 包括 在 中 间 路 由 器 的 缓冲 
时 延 ) 加 上 接收 方 处 理 一 个 分 组 所 需 的 时 间 。 在 很 多 网 络 中 ， 最 坏 情 况 下 的 最 大 时 延 是 很 
难 估算 的 ， 确 定 的 因素 非常 少 。 此 外 ， 理 想 的 协议 应 尽 可 能 快 地 从 丢 包 中 恢复 出 来 ; FIF 
一 个 最 坏 情况 的 时 延 可 能 意味 着 要 等 待 一 段 较 长 的 时 间 ， 直 到 局 动 差错 恢复 为 止 。 因 此 实 
践 中 采取 的 方法 是 发 送 方 明智 地 选择 一 个 时 间 值 ， 以 判定 可 能 发 生 了 丢 包 (尽管 不 能 确 
保 ) 。 如 果 在 这 个 时 间 内 没有 收 到 ACK， 则 重 传 该 分 组 。 注 意 到 如 果 一 个 分 组 经 历 了 一 个 
特别 大 的 时 延 ， 发 送 方 可 能 会 重 传 该 分 组 ， 即 使 该 数据 分 组 及 其 ACK 都 没有 丢失 。 这 就 
在 发 送 方 到 接收 方 的 信道 中 引入 了 宛 余 数据 分 组 (duplicate data packet) 的 可 能 性 。 垃 运 
的 是 ，rdt2. 2 协议 已 经 有 足够 的 功能 ( 即 序 号 ) 来 处 理 元 余 分 组 情况 。 

从 发 送 方 的 观点 来 看 ， 重 传 是 一 种 万 能 灵 药 。 发 送 方 不 知道 是 一 个 数据 分 组 丢失 ， 还 
是 一 个 ACK 丢失 ,或 者 只 是 该 分 组 或 ACK 过 度 延 时 。 在 所 有 这 些 情 况 下 ， 动 作 是 同样 
的 : 重 传 。 为 了 实现 基于 时 间 的 重 传 机 制 ， 需 要 一 个 倒 计 数 定时 器 (countdown timer) ,在 
一 个 给 定 的 时 间 量 过 期 后 ， 可 中 断 发 送 方 。 因 此 ， 发 送 方 需要 能 做 到 : 山 每 次 发 送 一 个 分 
组 〈 包 括 第 一 次 分 组 和 重 传 分 组 ) 时 ,， 便 启动 一 个 定时 器 。@ 响 应 定时 器 中 断 (采取 适 
当 的 动作 ) 。 鸟 终止 定时 器 。 

图 3-15 给 出 了 rdt3.0 的 发 送 方 FSM， 这 是 一 个 在 可 能 出 错 和 丢 包 的 信道 上 可 靠 传 


rdt_send (data) 


sndpkt=make_pkt (0,data, checksum) 
udt_send (sndpkt) 
start_timer 


isACK (rcvpkt,1)) 
/) A 


` 


、 
N 
N 
、 
rdt_rcv (rcvpkt) ` 
人 ( . 等 待 来 自 | tie oy timeout 
! 上 层 的 | 网 ACK0O udt_send (sndpkt) 


调用 0 start_timer 


rdt_rcv(rcevpkt) && 
(corrupt (rcvpkt) | | 


rdt_rcev(rcvpkt) 

&& notcorrupt (rcvpkt) 

&& isACK (rcvpkt,1) rdt_rcv (rcvpkt) 
3 && notcorrupt (rcvpkt) 

stop_timer 

pia && isACK (rcvpkt, 0) 
stop_timer 
timeout 


udt_send (sndpkt) 


ACK 1 上 层 的 
start_timer ; \ 调用 1 
. N rdt_rcv(zcvPkt) 
rdt_rcv(rcvpkt) && We aa A 


(corrupt (rcvpkt) | | 
isACK (rcvpkt, 0) ) rdt_send (data) 
A sndpkt=make_pkt (1,data, checksum) 
udt_send (sndpkt) 
start timer 


图 3-15 rdt3.0 发 送 方 
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输 数据 的 协议 ; 在 课 后 习题 中 ， 将 请 你 提供 rdt3.0 的 接收 方 FSM。 图 3-16 显示 了 在 没 
有 丢 包 和 延迟 分 组 情况 下 协议 运作 的 情况 ， 以 及 它 是 如 何 处理 数 据 分 组 丢失 的 。 在 
图 3-16 中 ， 时 间 从 图 的 项 部 朝 底部 移动 ; 注意 到 一 个 分 组 的 接收 时 间 必 定 迟 于 一 个 分 
组 的 发 送 时 间 ， 这 是 因为 发 送 时 延 与 传播 时 延 之 故 。 在 图 3-16b ~d 中 ， 发 送 方 括号 部 
分 表明 了 定时 带 的 设置 时 刻 以 及 随后 的 超时 。 本 章 后 面 的 习题 探讨 了 该 协议 几 个 更 细微 
的 方面 。 因 为 分 组 序号 在 0 和 1 之 间 交 蔡 ， 因 此 rdB. 0 有 时 被 称 为 比特 交替 协议 (alter- 


nating- bit protocol ) 。 


发 送 方 接收 方 发 送 方 接收 方 
Pkto . 、 k 
发 送 分 组 0 : 发 送 分 组 0 tO 
~ 接收 分 组 0 on 
we: 发 送 ACK 0 接收 ACK0 ， 发 送 ACK 0 
接收 ACK 0 - k 发 送 分 组 1 : A 
发 送 分 组 1 we NN kag 
:接收 分 组 1 超时 | : 


J 9 

RISACK 1 重 发 分 组 1 
接收 ACK 1 : kt à k 
Rao: “0 


Ni 


- 接收 分 组 1 


ss 发 送 ACK 0 a 发 送 ACK | 
| | è 接收 ACK ) kto . 
5 有 发 送 ACK 0 
a) 无 丢 包 操作 。 b) PABA 
发 送 方 接收 方 发 送 方 接收 方 
RM O 发 送 分 组 0 ; pko f 
; ;接收 分 组 0 
Ye: 发 j -接收 分 组 0 
Ne : 发 送 ACK 0 eo ° . P 发 送 ACK 0 
接收 ACK 0 六 : S Pkt] a 
nn :接收 分 组 1 me :接收 分 组 1 
> Room ; 发 送 ACK | Pee 发 送 ACK | 
重 发 分 组 :一 Bk o: DS won 
| er 接收 分 组 1 RHO. pkio SS 发 送 ACK | 
:ACE 一 : (检测 宛 余 ) 
接收 ACK 1; a :发送 ACK | l ;接收 分 组 0 
"peg 发 送 ACK 1 ;发送 ACK 0 


ee i 什么 也 不 做 : 
a 发 送 ACK 0 
c) 丢失 ACK d) 过 早 超时 
图 3-16 rdt3. 0 的 运行 ， 比 特 交 蔡 协 议 
现在 我 们 归纳 一 下 数据 传输 协议 的 要 点 。 在 检验 和 、 序 号 、 定 时 器 、 肯 定 和 和 否定 确认 
分 组 这 些 技术 中 ， 每 种 机 制 都 在 协议 的 运行 中 起 到 了 必 不 可 少 的 作用 。 至 此 ， 我 们 得 到 了 
一 个 可 徘 数据 传输 协议 ! 


WU 
© 


di.. 


3.4.2 流水 线 可 靠 数 据 传输 协议 


rdt3. 0 是 一 个 功能 正确 的 协议 ， 但 并 非 人 人 都 对 它 的 性 能 满意 ， 特 别 是 在 今天 的 高 速 
网 络 中 更 是 如 此 。rdB. 0 性 能 问题 的 核心 在 于 它 是 一 个 停 等 协议 。 

为 了 评价 该 停 等 行为 对 性 能 的 影响 ， 可 考虑 一 种 具有 两 台 主 机 的 理想 化 场合 ， 一 人 台 主 
机 位 于 美国 西海 岸 ， 另 一 台 位 于 美国 东海 岸 ， 如 图 3-17 所 示 。 在 这 两 个 端 系统 之 间 的 光 
速 往返 传播 时 延 RTT 大 约 为 30 毫秒。 假定 彼此 通过 一 条 发 送 速率 R 为 1Gbps (每 秒 10 比 
特 ) 的 信道 相连 。 包 括 首 部 字段 和 数据 的 分 组 长 工 为 1000 字 节 (8000 比特 ) ， 发 送 一 个 
分 组 进入 1Gbps 链 路 实际 所 需 时 间 是 : 


L _ 8000bit/pkt 
< 10° bit/s 


= 8ys/pkt 





a) 一 个 运行 中 的 停 等 协议 b) 一 个 运行 中 的 流水 线 协 议 
图 3-17 停 等 协议 与 流水 线 协议 


图 3-18a 显示 了 对 于 该 停 等 协议 ， 如 果 发 送 方 在 上 =0 时 刻 开 始 发 送 分 组 ， 则 在 1 = 
LR=8hs 后 ， 最 后 1 比特 数据 进入 了 发 送 端 信道 。 该 分 组 经 过 15ms 的 穿越 国家 的 旅途 后 
到 达 接 收 端 ， 该 分 组 的 最 后 1 比特 在 时 刻 上 = RTT/2 + LAR =15. 008ms 时 到 达 接 收 方 。 为 了 
简化 起 见 ， 假 设 ACK 分 组 很 小 〈 以 便 我 们 可 以 忽略 其 发 送 时 间 ) ， 接 收 方 一 旦 收 到 一 个 数 
据 分 组 的 最 后 1 比特 后 立即 发 送 ACK, ACK 在 时 刻 上 =RTT + L/R = 30. 008ms 时 在 发 送 方 
出 现 。 此 时 ， 发 送 方 可 以 发 送 下 一 个 报 文 。 因 此 ， 在 30. 008ms 内 ， 发 送 方 的 发 送 只 用 了 
0. 008ms。 如 果 我 们 定义 发 送 方 (或 信道 ) 的 利用 率 (utilization) 为 : 发 送 方 实际 忙于 将 
发 送 比特 送 进 信道 的 那 部 分 时 间 与 发 送 时 间 之 比 ， 图 3-18a 中 的 分 析 表 明了 停 等 协议 有 着 
非常 低 的 发 送 方 利用 率 Uende : 


这 就 是 说 ， 发 送 方 只 有 万 分 之 2.7 时 间 是 忙 的 。 从 其 他 角度 来 看 ， 发 送 方 在 30. 008ms 
内 只 能 发 送 1000 字 节 ， 有 效 的 吞吐 量 仅 为 267kbps， 即 使 有 1Gbps 的 链 路 可 用 也 是 如 此 ! 
想象 一 个 不 幸 的 网 络 经 理 购买 了 一 条 千 兆 比 容量 的 链 路 ， 但 他 仅 能 得 到 267kbps 吞吐 量 的 
情况 ! 这 是 一 个 形象 的 网 络 协议 限制 底层 网 络 硬件 所 提供 的 能 力 的 图 例 。 而 且 ， 我 们 还 忽 
略 了 在 发 送 方 和 接收 方 的 底层 协议 处 理 时 间 ， 以 及 可 能 出 现在 发 送 方 与 接收 方 之 间 的 任何 
中 间 路 由 器 上 的 处 理 与 排队 时 延 。 考 虑 到 这 些 因 素 ， 将 进一步 增加 时 延 ， 使 其 性 能 更 
糟糕 。 

这 种 特殊 的 性 能 问题 的 一 个 简单 解决 方法 是 : 不 以 停 等 方式 运行 ， 允 许 发 送 方 发 送 多 
个 分 组 而 无 须 等 待 确认 ， 如 在 图 3-17b 图 示 的 那样 。 图 3-18b 显示 了 如 果 发 送 方 可 以 在 等 
待 确认 之 前 发 送 3 个 报 文 ， 其 利用 率 也 基本 上 提高 3 倍 。 因 为 许多 从 发 送 方向 接收 方 输送 
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的 分 组 可 以 被 看 成 是 填充 到 一 条 流水 线 中 ， 故 这 种 技术 被 称 为 流水 线 (pipelining). ii 7k 
线 技术 对 可 靠 数 据 传输 协议 可 市 来 如 下 影响 : 


接收 方 








首 个 分 组 的 第 1 个 

比特 被 传输 ， t=0 

首 个 分 组 的 最 后 1 个 比特 
被 传输 ，f=L/R : 
:一 首 个 分 组 的 第 1 个 比特 到 达 

:一 首 个 分 组 的 最 后 1 个 比特 到 达 ; 发 送 ACK 


ACK 到 达 ， 发 送 下 一 个 分 组 ， ss : 


t= RTT + L/R 。 : 
à a) 停 等 操作 “ 
接收 方 
首 个 分 组 的 第 1 个 
比特 被 发 送 ，:=0 
首 个 分 组 的 最 后 1 个 比特 
被 发 送 ， t=L/R 


:一 首 个 分 组 的 第 1 个 比特 到 达 

:一 首 个 分 组 的 最 后 1 个 比特 到 达 ， 发 送 ACK 

:一 第 2 个 分 组 的 最 后 1 个 比特 到 达 ， 发 送 ACK 
:一 第 3 个 分 组 的 最 后 1 个 比特 到 达 ， 发 送 ACK 

ACK 到 达 ， 发 送 下 一 个 分 组 ， : 

t= RTT + L/R ES 


b) 流水 线 操 作 
K 3-18 停 等 和 流水 线 发 送 


。 必须 增加 序号 范围 ， 因 为 每 个 输送 中 的 分 组 (不 计算 重 传 的 ) 必须 有 一 个 唯一 的 
序号 ， 而 且 也 许 有 多 个 在 输送 中 的 未 确认 报 文 。 

© 协议 的 发 送 方 和 接收 方 两 端 也许 不 得 不 缓存 多 个 分 组 。 发 送 方 最 低 限 度 应 当 能 组 
冲 那 些 已 发 送 但 没有 确认 的 分 组 。 如 下 面 讨论 的 那样 ， 接 收 方 或 许 也 需要 缓存 那 
些 已 正确 接收 的 分 组 。 

所 需 序 号 范围 和 对 缓冲 的 要 求 取决 于 数据 传输 协议 如 何 处 理 丢失 、 损 坏 及 延 时 过 
大 的 分 组 。 解 决 流水 线 的 差错 恢复 有 两 种 基本 方法 是 : 回 退 Nw ( Go-Back-N, 
CBN ) 和 选择 重 传 (Selective Repeat, SR) 。 


3.4.3 回 退 信步 


在 回 退 N 步 (GBN) 协议 中 ， 人 允许 发 送 方 发 送 多 个 分 组 ( 当 有 多 个 分 组 可 用 时 ) 而 
不 需 等 待 确认 ， 但 它 也 受 限 于 在 流水 线 中 未 确认 的 分 组 数 不 能 超过 某 个 最 大 允许 数 N。 在 
本 节 中 我 们 较为 详细 地 描述 CBN。 但 在 继续 阅读 之 前 ， 建 议 你 操作 本 书 配套 Web 网 站 上 
的 CBN Java 小 程序 (这 是 一 个 非常 好 的 Java 程序 ) 。 

图 3-19 显示 了 发 送 方 看 到 的 CBN 协议 的 序号 范围 。 如 果 我 们 将 基 序 号 (base) 定义 
为 最 早 未 确认 分 组 的 序号 ， 将 下 一 个 序号 (nextseqnum) 定义 为 最 小 的 未 使 用 序号 ( 即 下 
一 个 待 发 分 组 的 序号 ) ， 则 可 将 序号 范围 分 割 成 4 段 。 在 [0，base -1] 段 内 的 序号 对 应 
于 已 经 发 送 并 被 确认 的 分 组 。[ base ，nextseqnum -1] 段 内 对 应 已 经 发 送 但 未 被 确认 的 分 
#4, [nextseqnum, base+N-1] 段 内 的 序号 能 用 于 那些 要 被 立即 发 送 的 分 组 ， 如 果 有 数 
据 来 自 上 层 的 话 。 最 后 ， 大 于 或 等 于 base +N 的 序号 是 不 能 使 用 的 ， 直 到 当前 流水 线 中 未 
被 确认 的 分 组 (特别 是 序号 为 base 的 分 组 ) 已 得 到 确认 为 止 。 

基 序号 下 一 个 序号 


(base) (nextseqnum) 


图 例 : 


UN 和 


发 送 ， 还 未 
nee law [om 
N 


图 3-19 在 CBN 中 发 送 方 看 到 的 序号 


如 图 3-19 所 提示 的 那样 ， 那 些 已 被 发 送 但 还 未 被 确认 的 分 组 的 许可 序号 范围 可 以 被 
看 成 是 一 个 在 序号 范围 内 长 度 为 NN 的 窗口 。 随 着 协议 的 运行 ， 该 窗口 在 序号 空间 向 前 滑 
zj R, N 常 被 称 为 窗口 长 度 (window size), CBN 协议 也 常 被 称 为 滑动 窗口 协议 
( sliding- window protocol) 。 你 也 许 想 知道 ， 我 们 为 什么 先 要 限制 这 些 被 发 送 的 、 未 被 确认 
的 分 组 的 数目 为 N 呢 ? 为 什么 不 允许 这 些 分 组 为 无 限制 的 数目 呢 ? 我 们 将 在 3.5 节 看 到 ， 
流量 控制 是 对 发 送 方 施加 限制 的 原因 之 一 。 我 们 将 在 3.7 节 学 习 TCP 拥塞 控制 时 分 析 男 一 
个 原因 。 

在 实践 中 ， 一 个 分 组 的 序号 承载 在 分 组 首部 的 一 个 固定 长 度 的 字段 中 。 如 果 分 组 序号 
字段 的 比特 数 是 k， 则 该 序号 范围 是 [0，2” -1] 。 在 一 个 有 限 的 序号 范围 内 ， 所 有 涉及 序 
号 的 运算 必须 使 用 模 2 运算。 ( 即 序号 空间 可 被 看 作 是 一 个 长 度 为 2 的 环 ， 其 中 序号 
2 -1 紧 接 着 序号 0。) 前 面 讲 过 ，rdt3.0 有 一 个 1 比特 的 序号 ， 序 号 范围 是 [0，1 ] 。 在 本 
章 末 的 几 道 习 题 中 探讨 了 一 个 有 限 的 序号 范围 所 产生 的 结果 。 我 们 将 在 3. 5 节 看 到 ，TCP 
有 一 个 32 比特 的 序号 字段 ， 其 中 的 TCP 序号 是 按 字 节 流 中 的 字 节 进行 计数 的 ， 而 不 是 按 
分 组 计数 。 

图 3-20 和 图 3-21 给 出 了 一 个 基于 ACK、 无 NAK 的 CBN 协议 的 发 送 方 和 接收 方 这 两 
端的 扩展 FSM 描述 。 我 们 称 该 FSM 描述 为 扩展 FSM， 是 因为 我 们 已 经 增加 了 变量 (类似 
于 编程 语言 中 的 变量 ) base 和 nextseqnum， 还 增加 了 对 这 些 变 量 的 操作 以 及 与 这 些 变 量 有 
关 的 条 件 动作 。 注 意 到 该 扩展 的 FSM 规约 现在 变 得 有 点 像 编 程 语言 规约 。 |[ Bochman 
1984] 对 FSM 扩展 技术 提供 了 一 个 很 好 的 综述 ， 也 提供 了 用 于 定义 协议 的 其 他 基于 编程 
语言 的 技术 。 


rdt_send (data) 


if (nextseqnum<base+N) { 
sndpkt [nextseqnum]=make_pkt (nextseqnum, data, checksum) 
udt_send (sndpkt [nextseqnum] ) 
if (base==nextseqnum) 


ae start_timer 
A Oa nextseqnum++ 
SE a ~ 
base=1 i } 
nextseqnum=1 i else 
hc refuse an 
Sag 
‘N 
‘N 
iS 
timeout 
start_timer 
等 待 udt_send(sndpkt [base] ) 
udt_send(sndpkt [base+1]) 
rdt_rev(revpkt) && corrupt (rcvpkt) 
pereeman correc ( cae _send(sndpkt [nextseqnum-1] ) 


~VU notcorrupt (rcvpkt) 


base=getacknum(rcevpkt) +1 
If (base==nextseqnum) 
stop_timer 
else 
start_timer 


FA 3-20 GBN 发 送 方 的 扩展 FSM 描述 


rdt_rcv (rcvpkt) 
&& notcorrupt (rcvpkt) 
&& hasseqnum(rcvpkt, expectedsegqnum) 


extract (rcvpkt, data) 

deliver_data (data) 

sndpkt=make_pkt (expectedseqnum, ACK, checksum) 
udt_send(sndpkt) 

ew 


me | Ree — — 
人 rb _send(sndpkt) 


expectedseqnum=1 
sndpkt=make_pkt (0, ACK, checksum) 


图 3-21 CBN 接收 方 的 扩展 FSM 描述 


GBN 发 送 方 必 须 啊 应 三 种 类 型 的 事件 : 
e 上 层 的 调用 。 当 上 层 调 用 rdt_send() 时 ,发送 方 首先 检查 发 送 窗口 是 否 已 满 ， 即 是 


否 用 个 已 发 送 但 未 被 确认 的 分 组 。 如 果 窗 口 未 满 ， 则 产生 一 个 分 组 并 将 其 发 送 ， 
并 相应 地 更 新 变量 。 如 果 和 窗口 已 满 ， 发 送 方 只 需 将 数据 返回 给 上 层 ， 隐 式 地 指示 
上 层 该 窗口 已 满 。 然 后 上 层 可 能 会 过 一 会 儿 再 试 。 在 实际 实现 中 ， 发 送 方 更 可 能 
缓存 (并 不 立刻 发 送 ) 这 些 数据 ， 或 者 使 用 同步 机 制 〈 如 一 个 信和 号 量 或 标志 ) 多 
许 上 层 在 仅 当 窗口 不 满 时 才 调 用 rdt_send() 。 

收 到 一 个 ACK。 在 CBN 协议 中 ， 对 序号 为 n 的 分 组 的 确认 采取 累积 确认 (cumu- 
lative acknowledgment) 的 方式 ， 表 明 接 收 方 已 正确 接收 到 序号 为 n 的 以 前 且 包 括 n 
在 内 的 所 有 分 组 。 稍 后 讨论 CBN 接收 方 一 端 时 ， 我 们 将 再 次 研究 这 个 主题 。 


o 超时 事件 。 协 议 的 名 字 “ 回 退 入 步 ” 来 源 于 出 现 丢 失 和 时 延 过 长 分 组 时 发 送 方 的 
行为 。 就 像 在 停 等 协议 中 那样 ， 定 时 器 将 再 次 用 于 恢复 数据 或 确认 分 组 的 丢失 。 
如 果 出 现 超时 ， 发 送 方 重 传 所 有 已 发 送 但 还 未 被 确认 过 的 分 组 。 图 3-20 中 的 发 送 
方 仅 使 用 一 个 定时 句 ， 它 可 被 当 作 是 最 早 的 已 发 送 但 未 被 确认 的 分 组 所 使 用 的 定 
时 器 。 如 果 收 到 一 个 ACK， 但 仍 有 已 发 送 但 未 被 确认 的 分 组 ， 则 定时 器 被 重新 局 
动 。 如 果 没 有 已 发 送 但 未 被 确认 的 分 组 ， 停 止 该 定时 器 。 

在 CBN 中 ， 接 收 方 的 动作 也 很 简单 。 如 果 一 个 序号 为 n 的 分 组 被 正确 接收 到 ， 并 且 
按 序 ( 即 上 次 交付 给 上 层 的 数据 是 序号 为 n -1 的 分 组 )， 则 接收 方 为 分 组 n 发 送 一 个 
ACK， 并 将 该 分 组 中 的 数据 部 分 交付 到 上 层 。 在 所 有 其 他 情况 下 ， 接 收 方 丢弃 该 分 组 ， 并 
为 最 近 按 序 接收 的 分 组 重新 发 送 ACK。 注 意 到 因为 一 次 交付 给 上 层 一 个 分 组 ， 如 果 分 组 % 
已 接收 并 交付 ， 则 所 有 序号 比 小 的 分 组 也 已 经 交付 。 因 此 ,使 用 累积 确认 是 CBN 一 个 
卓然 的 选择 。 

在 GBN 协议 中 ， 接 收 方 丢弃 所 有 失 序 分 组 。 尽 管 丢 弃 一 个 正确 接收 (但 失 序 ) 的 分 
组 有 点 愚蠢 和 浪费 ,但 这 样 做 是 有 理由 的 。 前 面 讲 过 ， 接 收 方 必 须 按 序 将 数据 交付 给 上 
层 。 假 定 现在 期 望 接收 分 组 n， 而 分 组 n+1 却 到 了 。 因 为 数据 必须 按 序 交 付 ， 接 收 方 可 能 
缓存 (保存 ) 分 组 n+1， 然后， 在 它 收 到 并 交付 分 组 n 后 ， 再 将 该 分 组 交付 到 上 层 。 然 
而 ， 如 果 分 组 n 丢失 ， 则 该 分 组 及 分 组 n+1 最 终 将 在 发 送 方 根据 CBN 重 传 规 则 而 被 重 
传 。 因 此 ， 接 收 方 只 需 丢 痉 分 组 n+1 即 可 。 这 种 方法 的 优点 是 接收 缓存 简单 ， 即 接收 方 
不 需要 缓存 任何 失 序 分 组 。 因 此 ,虽然 发 送 方 接收 方 
发 送 方 必须 维护 窗口 的 上 下 边界 及 发 送 分 组 0 : : 
nextseqnum 在 该 窗口 中 的 位 置 ， 但 是 接 B 
收 方 需要 维护 的 唯一 信息 就 是 下 一 个 按 gypa: 
序 接收 的 分 组 的 序号 。 该 值 保存 在 ex- : : 
pectedseqnum 变量 中 ， 如 图 3-21 中 接收 





发 送 分 组 2 : 


方 FSM 所 示 。 当 然 ， 丢 弃 一 个 正确 接收 emia 
的 分 组 的 缺点 是 随后 对 该 分 组 的 重 传 了 | 


许 会 丢失 或 出 错 ， 因 此 甚至 需要 更 多 的 (等 待 ) 3 


重 传 。 : 接收 分 组 3， 丢 弃 
图 3-22 给 出 了 窗口 长 度 为 4 个 分 组 J PEAK | 

的 GBN 协议 的 运行 情况 。 因 为 该 窗口 | acko: : 

长 度 的 限制 ， 发 送 方 发 送 分 组 0 ~3， 然 | RAMA: 

后 在 继续 发 送 之 前 ， 必 须 等 待 直 到 一 个 | 发 送 分 组 5 re 

或 多 个 分 组 被 确认 。 当 接收 到 每 一 个 连 OKE: 

续 的 ACK (Hlan ACK 0 和 ACK 1) 时 ， NZ 

该 窗口 便 向 前 滑动 ， 发 送 方便 可 以 发 送 发 送 分 组 3 No pe . 

新 的 分 组 (分 别 是 分 组 4 和 分 组 5) te 发 送 分 组 4 : 

接收 方 ， 分 组 2 丢失 ， 因 此 分 组 3、4 | RA SSS as 

和 5 被 发 现 是 失 序 分 组 并 被 丢弃 。 : ; 接收 分 组 3， 交付 
在 结束 对 GBN 的 讨论 之 前 ， 需 要 : 上 :发 送 ACK3 

提请 注意 的 是 ， 在 协议 栈 中 实现 该 协议 v M 


可 能 与 图 3-20 中 的 扩展 FSM 有 相似 的 图 3-22 运行 中 的 CBN 
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结构 。 该 实现 也 可 能 是 以 各 种 过 程 形式 出 现 ， 每 个 过 程 实现 了 在 啊 应 各 种 可 能 出 现 的 事件 
时 要 采取 的 动作 。 在 这 种 基于 事件 的 编程 (event-based programming) 方式 中 ， 这 些 过 程 
要 么 被 协议 栈 中 的 其 他 过 程 调 用 ， 要 么 作为 一 次 中 断 的 结果 。 在 发 送 方 ， 这 些 事件 包括 : 
中 来自 上 层 实 体 的 调用 去 调用 rdt_send(); @ 定 时 器 中 断 ; ORAA, 来自 下 层 的 调 
用 去 调用 rdt_rcv() 。 本 章 后 面 的 编程 作业 会 使 你 有 机 会 在 一 个 模拟 网 络 环境 中 实际 实现 这 
些 例 程 ， 但 该 环境 却 是 真实 的 。 

这 里 我 们 注意 到 ，GBN 协议 中 综合 了 我 们 将 在 3.5 节 中 学 习 TCP 可 靠 数据 传输 构件 
时 遇 到 的 所 有 技术 。 这 些 技术 包括 使 用 序号 、 累 积 确 认 、 检 验 和 以 及 超时 / 重 传 操作 。 


3.4.4 选择 重 传 


在 图 3-17 中 ，GBN 协议 潜在 地 允许 发 送 方 用 多 个 分 组 “填充 流水 线 ”， 因 此 避免 了 停 
等 协议 中 所 提 到 的 信道 利用 率 问题 。 然 而 ，GBN 本 身 也 有 一 些 情况 存在 着 性 能 问题 。 尤 其 
是 当 窗口 长 度 和 带宽 时 延 积 都 很 大 时 ， 在 流水 线 中 会 有 很 多 分 组 更 是 如 此 。 单 个 分 组 的 差 
错 就 能 够 引起 CBN 重 传 大 量 分 组 ， 许 多 分 组 根本 没有 必要 重 传 。 随 着 信道 差错 率 的 增加 ， 
流水 线 可 能 会 被 这 些 不 必要 重 传 的 分 组 所 充斥 。 想 象 一 下 ， 在 我 们 口述 消息 的 例子 中 ， 如 
果 每 次 有 一 个 单词 含糊 不 清 ， 其 前 后 1000 个 单词 (例如 ， 窗 口 长 度 为 1000 个 单词 ) 不 得 
不 被 重 传 的 情况 。 此 次 口述 会 由 于 这 些 反 复述 说 的 单词 而 变 慢 。 

顾名思义 ， 选 择 重 传 (SR) 协议 通过 让 发 送 方 仅 重 传 那些 它 怀疑 在 接收 方 出 错 ( 即 
丢失 或 受 损 ) 的 分 组 而 避免 了 不 必要 的 重 传 。 这 种 个 别 的 、 按 需 的 重 传 要 求 接收 方 逐 个 地 
确认 正确 接收 的 分 组 。 再 次 用 窗口 长 度 入 来 限制 流水 线 中 未 完成 、 未 被 确认 的 分 组 数 。 然 
而 ,与 CBN 不 同 的 是 ， 发 送 方 已 经 收 到 了 对 窗口 中 某 些 分 组 的 ACK。 图 3-23 显示 了 SR 
发 送 方 看 到 的 序号 空间 。 图 3-24 详细 描述 了 SR 发 送 方 所 采取 的 动作 。 


send base nextseqnum 


TO «Bes tee 
ae an * || nae 


a) 发 送 方 看 到 的 序号 


rcv base 


Ww | cca. 


窗口 长 度 N ey [|e 
D 接收 方 看 到 的 序号 
图 3-23 ”选择 重 传 (SR) 发 送 方 与 接收 方 的 序号 空间 
SR 接收 方 将 确认 一 个 正确 接收 的 分 组 而 不 管 其 是 否 按 序 。 失 序 的 分 组 将 被 缓存 直到 
所 有 丢失 分 组 〈 即 序号 更 小 的 分 组 ) 皆 被 收 到 为 止 ， 这 时 才 可 以 将 一 批 分 组 按 序 交 付 给 上 
层 。 图 3-25 详细 列 出 了 SR 接收 方 所 采用 的 各 种 动作 。 图 3-26 给 出 了 一 个 例子 以 说 明 出 
现 丢 包 时 SR 的 操作 。 值 得 注意 的 是 ， 在 图 3-26 中 接收 方 初始 时 缓存 了 分 组 3、4、5， 并 


在 最 终 收 到 分 组 2 时 ， 才 将 它们 一 并 交付 给 上 层 。 


1. 从 上 层 收 到 数据 。 当 从 上 层 接收 到 数据 后 ，SR 发 送 方 检查 下 一 个 可 用 于 该 分 组 的 序号 。 如 果 序 号 位 于 发 送 方 
的 窗口 内 ， 则 将 数据 打包 并 发 送 ; 否则 就 像 在 CBN 中 一 样 ， 要 么 将 数据 缓存 ， 要 么 将 其 返回 给 上 层 以 便 以 后 传输 。 
2. 超时 。 定 时 器 再 次 被 用 来 防止 丢失 分 组 。 然 而 ， 现 在 每 个 分 组 必须 拥有 其 自己 的 逻辑 定时 器 ， 因 为 超时 发 


生 后 只 能 发 送 一 个 分 组 。 可 以 使 用 单个 硬件 定时 器 模拟 多 个 逻辑 定时 器 的 操作 [Varghese 1997 ] 。 

3. 收 到 ACK。 如 果 收 到 ACK， 倘 若 该 分 组 序号 在 窗口 内 ， 则 SR 发 送 方 将 那个 被 确认 的 分 组 标记 为 已 接收 。 
如 果 该 分 组 的 序号 等 于 send_base， 则 窗口 基 序号 向 前 移动 到 具有 最 小 序号 的 未 确认 分 组 处 。 如 果 窗 口 移动 了 并 且 
有 序号 落 在 窗口 内 的 未 发 送 分 组 ， 则 发 送 这 些 分 组 。 





图 3-24 SR 发 送 方 的 事件 与 动作 


1. 序号 在 [rev_base, rev_base+N-1] 内 的 分 组 被 正确 接收 。 在 此 情况 下 ， 收 到 的 分 组 落 在 接收 方 的 窗口 
内 ， 一 个 选择 ACK 被 回 送 给 发 送 方 。 如 果 该 分 组 以 前 没收 到 过 ， 则 缓存 该 分 组 。 如 果 该 分 组 的 序号 等 于 接收 窗口 
的 基 序号 (图 3-23 中 的 rev_base) ， 则 该 分 组 以 及 以 前 缓存 的 序号 连续 的 〈 起 始 于 rev_base 的 ) 分 组 交付 给 上 层 。 
然后 ， 接 收 窗口 按 向 前 移动 分 组 的 编号 向 上 交付 这 些 分 组 。 举 例子 来 说 ， 考 虑 一 下 图 3-26。 当 收 到 一 个 序号 为 


rev_base =2 的 分 组 时 ， 该 分 组 及 分 组 3、4、5 可 被 交付 给 上 层 。 

2. AS [rev_base-N, rev_base-1] 内 的 分 组 被 正确 收 到 。 在 此 情况 下 ， 必 须 产 生 一 个 ACK， 即 使 该 分 组 
是 接收 方 以 前 已 确认 过 的 分 组 。 

3. 其 他 情况 。 忽 略 该 分 组 。 





图 3-25 SR 接收 方 的 事件 与 动作 


发 送 方 接收 方 

分 组 0 发 送 : ; 
Ra 
分 组 1 发 送 : : 分 组 0 收 到 ， 交 付 ，ACK ORE 
CaS 45678 9。 ”0 5 6 7 8 9 
分 组 ?发送 a ; 分 组 1 收 到 ， 交 付 ，ACK 1 发 送 
Wa 456789: X : 0 1 BMRB} 6 7 8 9 

: (EA) 
分 组 3 发 送 ， 窗 口 满 


gemma 456789° 


: 分 组 3 收 到 ， 缓 存 ，ACK 3 发 送 


ACK 0 收 到 ， 分 组 4 发 送 | : 0 1 到 本 WN 6 7 8 9 
01234 8 9: : 
ACK 1 收 到 ， 分 组 5 发 送 。 : : 分 组 4 收 到 ， 缓 存 ，ACK 4 发 送 
0 1M 6 7 8 9; : 0 1 RAB 6 7 8 9 
: ; 分 组 5 收 到 ， 缓 存 ，ACK 5 发 送 

分 组 2 超时 ， 重 传 分 组 2 : : 0 1 RSNA 6 78 9 
0 1 MMM 6 789: 

> 分 组 2 收 到 ， 分 组 2、3、4、5 交 付 ， 

> ACK 2 发 送 


“0123 4 5 Wm 


ACK 3 收 到 ， 无 分 组 可 发 
0 1 29S 6789.: 


t. å 
图 3-26 SR 操作 
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注意 到 图 3-25 中 的 第 二 步 很 重要 ， 接 收 方 重新 确认 〈 而 不 是 忽略 ) 已 收 到 过 的 那些 
序号 小 于 当前 窗口 基 序号 的 分 组 。 你 应 该 理解 这 种 重新 确认 确实 是 需要 的 。 例 如 ， 给 定 在 
图 3-23 中 所 示 的 发 送 方 和 接收 方 的 序号 空间 ， 如 果 分 组 send_base 的 ACK 没有 从 接收 方 传 
播 回 发 送 方 ， 则 发 送 方 最 终 将 重 传 分 组 send_base ， 即 使 显然 (对 我 们 而 不 是 对 发 送 方 来 
说 !) 接收 方 已 经 收 到 了 该 分 组 。 如 果 接 收 方 不 确认 该 分 组 ， 则 发 送 方 窗 口 将 永远 不 能 问 
前 滑动 ! 这 个 例子 说 明了 SR 协议 (和 很 多 其 他 协议 一 样 ) 的 一 个 重要 方面 。 对 于 哪些 分 
组 已 经 被 正确 接收 ， 哪 些 没有 ， 发 送 方 和 接收 方 并 不 总 是 能 看 到 相同 的 结果 。 对 SR 协议 
而 言 ， 这 就 意味 着 发 送 方 和 接收 方 的 窗口 并 不 总 是 一 致 。 

当 我 们 面 对 有 限 序号 范围 的 现实 时 ， 发 送 方 和 接收 方 窗口 间 缺 乏 同 步 会 产生 严重 的 后 
果 。 考 虑 下 面 例子 中 可 能 发 生 的 情况 ， 该 例 有 包括 4 个 分 组 序号 0、1、2、3 的 有 限 序号 
范围 旦 窗口 长 度 为 3。 假 定 发 送 了 分 组 0 至 2， 并 在 接收 方 被 正确 接收 且 确 认 了 。 此 时 ， 
接收 方 窗口 落 在 第 4、5、6 个 分 组 上 ， 其 序号 分 别 为 3、0、1。 现 在 考虑 两 种 情况 。 在 第 
一 种 情况 下 ， 如 图 3-27a 所 示 ， 对 前 3 个 分 组 的 ACK 丢失 ， 因 此 发 送 方 重 传 这 些 分 组 。 因 
此 ， 接 收 方 下 一 步 要 接收 序号 为 0 的 分 组 ， 即 第 一 个 发 送 分 组 的 副本 。 


发 送 方 窗 口 接收 方 窗口 
(接收 后 ) (接收 后 ) 


DTA 3 0 1 2 :分 组 0 





| : ‘ACK 0 0 AA o 1 2 
rues 3 0 1 2 ; s 


moe > 0 1 2 : “ACK 1 0 12°3°0 1 2 
Tae ° . 


‘ACK2 0 1 2 [Sad 2 


超时 ， 重 传 
分 组 0 : 
Weare 3 0 12 : :接收 具有 序号 0 的 分 组 
$ 
a) 
发 送 方 窗口 接收 方 窗口 
(接收 后 ) (接收 后 ) 


Mme 3 0 1 2 。 
FREE ACK 0 0 ie 3 615 
W3012: : 

oh :ACK1 0 120379 1 2 
Meme 3012: : 

- ZACK2 0 1 20i 2 
o W223 0 1 2 : 


01M 12: 





:接收 具有 序号 0 的 分 组 


， ; 
b) 
图 3-27 SR 接收 方 窗口 太 大 的 困境 : 是 一 个 新 分 组 还 是 一 次 重 传 


在 第 二 种 情况 下 ， 如 图 3-27b 所 示 ， 对 前 3 个 分 组 的 ACK 者 被 正确 交付 。 因 此 发 送 方 
向 前 移动 窗口 并 发 送 第 4、5、6 个 分 组 ， 其 序号 分 别 为 3、0、1。 序 号 为 3 的 分 组 丢失 ， 
但 序号 为 0 的 分 组 到 达 (一 个 包含 新 数据 的 分 组 ) 。 

现在 考虑 一 下 图 3-27 中 接收 方 的 观点 ， 在 发 送 方 和 接收 方 之 间 有 一 个 假想 的 帘子 ， 
因为 接收 方 不 能 “看 见 ” 发 送 方 采 取 的 动作 。 接 收 方 所 能 观察 到 的 是 它 从 信道 中 收 到 的 以 
及 它 向 信道 中 发 出 报 文 序列 。 就 其 所 关注 的 而 言 ， 图 3-27 中 的 两 种 情况 是 等 同 的 。 没 有 
办 法 区 分 是 第 1 个 分 组 的 重 传 还 是 第 5 个 分 组 的 初次 传输 。 显 然 ， 窗 口 长 度 比 序号 空间 小 
1 时 协议 无 法 工作 。 但 窗口 必须 多 小 呢 ? 本 章 后 面 的 一 道 习 题 请 你 说 明 为 何 对 于 SR 协议 
而 言 ， 窗 口 长 度 必须 小 于 或 等 于 序号 空间 大 小 的 一 半 。 

在 本 书 配套 的 网 站 上 ， 可 以 找到 一 个 模仿 SR 协议 运行 的 Java 小 程序 。 尝 试 进 行 你 以 
前 对 CBN Java 小 程序 所 进行 的 相同 的 实验 。 这 些 结果 与 你 期 望 的 一 致 吗 ? 

至 此 我 们 结束 了 对 可 靠 数 据 传输 协议 的 讨论 。 我 们 已 涵盖 许多 基础 知识 ， 并 介绍 了 多 
种 机 制 ， 这 些 机 制 可 一 起 提供 可 靠 数 据 传输 。 表 3-1 总 结 这 些 机 制 。 既 然 我 们 已 经 学 习 了 
所 有 这 些 运行 中 的 机 制 ， 并 能 看 到 “全 景 ”， 我 们 建议 你 再 复习 一 遍 本 节 内 容 ， 看 看 这 些 
机 制 是 怎样 逐步 被 添加 进来 ， 以 涵盖 复杂 性 渐 增 的 〈 现 实 的) 连接 发 送 方 与 接收 方 的 各 种 
信道 模型 的 ， 或 者 如 何 改善 协议 性 能 的 。 


表 3-1 ”可靠 数 据 传输 机 制 及 其 用 途 的 总 结 


机 制 用 途 和 说 明 
检验 和 用 于 检测 在 一 个 传输 分 组 中 的 比特 错误 
定时 器 用 于 超时 / 重 传 一 个 分 组 ， 可 能 因为 该 分 组 (或 其 ACK) 在 信道 中 丢失 了 。 由 于 当 一 个 分 组 延 


时 但 未 丢失 (过 早 超 时 ) ,或 当 一 个 分 组 已 被 接收 方 收 到 但 从 接收 方 到 发 送 方 的 ACK 丢失 时 ， 可 
能 产生 超时 事件 ， 所 以 接收 方 可 能 会 收 到 一 个 分 组 的 多 个 元 余 副本 


序号 用 于 为 从 发 送 方 流向 接收 方 的 数据 分 组 按 顺 序 编号 。 所 接收 分 组 的 序号 间 的 空 阶 可 使 接收 方 检 
测 出 丢失 的 分 组 。 具 有 相同 序号 的 分 组 可 使 接收 方 检测 出 一 个 分 组 的 元 余 副本 

-确认 接收 方 用 于 告诉 发 送 方 一 个 分 组 或 一 组 分 组 已 被 正确 地 接收 到 了 。 确 认 报 文通 常 携带 着 被 确认 
的 分 组 或 多 个 分 组 的 序号 。 确 认可 以 是 逐个 的 或 累积 的 ， 这 取决 于 协议 

否定 确认 接收 方 用 于 告诉 发 送 方 某 个 分 组 未 被 正确 地 接收 。 否 定 确认 报 文通 常 携带 着 未 被 正确 接收 的 分 
组 的 序号 


窗口 、 流 水 线 发 送 方 也 许 被 限制 仅 发 送 那 些 序号 落 在 一 个 指定 范围 内 的 分 组 。 通 过 允许 一 次 发 送 多 个 分 组 但 
未 被 确认 ， 发 送 方 的 利用 率 可 在 停 等 操作 模式 的 基础 上 得 到 增加 。 我 们 很 快 将 会 看 到 ， 窗 口 长 度 
可 根据 接收 方 接收 和 缓存 报 文 的 能 力 、 网 络 中 的 拥塞 程度 或 两 者 情况 来 进行 设置 


我 们 通过 考虑 在 底层 信道 模型 中 的 一 个 遗留 假设 来 结束 对 可 靠 数 据 传输 协议 的 讨论 。 
前 面 讲 过 ,我 们 曾 假定 分 组 在 发 送 方 与 接收 方 之 间 的 信道 中 不 能 被 重新 排序 。 这 在 发 送 方 
与 接收 方 由 单 段 物理 线路 相连 的 情况 下 ,通常 是 一 个 合理 的 假设 。 然 而 ， 当 连接 两 端的 
“信道 ”是 一 个 网 络 时 ， 分 组 重新 排序 是 可 能 会 发 生 的 。 分 组 重新 排序 的 一 个 表现 就 是 ， 
一 个 具有 序号 或 确认 号 x 的 分 组 的 旧 副 本 可 能 会 出 现 ， 即 使 发 送 方 或 接收 方 的 窗口 中 都 没 
有 包含 x。 对 于 分 组 重新 排序 ， 信 道 可 被 看 成 基本 上 是 在 缓存 分 组 ， 并 在 将 来 任意 时 刻 自 
然 地 释放 出 这 些 分 组 。 由 于 序号 可 以 被 重新 使 用 ， 那 么 必须 小 心 ， 以 免 出 现 这 样 的 元 余 分 
组 。 实 际 应 用 中 采用 的 方法 是 ， 确 保 一 个 序号 不 被 重新 使 用 ， 直 到 发 送 方 “确信 ”任何 先 
前 发 送 的 序号 为 x 的 分 组 都 不 再 在 网 络 中 为 止 。 通 过 假定 一 个 分 组 在 网 络 中 的 “存活 ”时 
间 不 会 超过 某 个 固定 最 大 时 间 量 来 做 到 这 一 点 。 在 高 速 网 络 的 TCP 扩展 中 ， 最 长 的 分 组 寿 
命 被 假定 为 大 约 3 分 钟 [RFC 1323], [Sunshine 1978] 描述 了 一 种 使 用 序号 的 方法 ， 它 能 
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够 完全 避免 重新 排序 问题 。 
3.5 面向 连接 的 运输 : TCP 


既然 我 们 已 经 学 习 了 可 靠 数 据 传 输 的 基本 原理 ,我 们 就 可 以 转 而 学 习 TCP 了 。TCP 是 
因特网 运输 层 的 面向 连接 的 可 靠 的 运输 协议 。 我 们 在 本 节 中 将 看 到 ， 为 了 提供 可 靠 数 据 传 
输 ，TCP 依赖 于 前 一 节 所 讨论 的 许多 基本 原理 ， 其 中 包括 差错 检测 、 重 传 、 累 积 确认 、 定 
时 器 以 及 用 于 序号 和 确认 号 的 首部 字段 。TCP 定义 在 RFC 793、RFC 1122 、RFC 1323 、 
RFC 2018 以 及 RFC 2581 中 。 


3.5.1 TCP 连接 


TCP 被 称 为 是 面向 连接 的 (connection- oriented ) ， 这 是 因为 在 一 个 应 用 进程 可 以 开始 
回 另 一 个 应 用 进程 发 送 数据 之 前 ， 这 两 个 进程 必须 先 相 互 “握手 ” ， 即 它们 必须 相互 发 送 
某 些 预备 报 文 段 ， 以 建立 确保 数据 传输 的 参数 。 作 为 TCP 连接 建立 的 一 部 分 ， 连 接 的 双方 
都 将 初始 化 与 TCP 连接 相关 的 许多 TCP 状态 变量 (其 中 的 许多 状态 变量 将 在 本 节 和 3.7 
节 中 讨论 ) 。 


Vinton Cerf 和 Robert Kahn 与 TCP/IP | 


在 20 世纪 70 年 代 早 期 ， 分 组 交换 网 开始 飞速 增长 ， 而 因特网 的 前 身 ARPAnet 也 只 
| 是 当时 众多 分 组 交换 网 中 的 一 个 。 这 些 网 络 都 有 它们 各 自 的 协议 。 两 个 研究 人 员 Vinton 
| Cerf 和 Robert Kahn 认识 到 互联 这 些 网 络 的 重要 性 ， 发 明了 沟通 网 络 的 TCP/IP . 
协议 代表 传输 控制 协议 /网 际 协 议 (Transmission Control Protocol/Internet Protocol) 。 
| Cerf 和 Kahn 开始 时 把 该 协议 看 成 是 单一 的 实体 ， 但 是 后 来 将 它 分 成 单独 运行 的 
| 分 : TCP 和 IP, Cerf 和 Kahn 在 1974 年 5 月 的 《IEEE Transactions on Communications 
Technology) 杂志 上 发 表 了 一 篇 关于 TCP/IP 的 论文 [ Cerf 1974]. 
| TCP/IP 协议 是 当今 因特网 的 支柱 性 协议 ， 但 它 的 发 明 先 于 PC、 工作 和 站、 智能 手机 

FP HEA, ATAKA, BA, DSL, WiFi 和 其 他 接 入 网 技术 的 激增 ， 先 于 Web、 社 
交 媒 体 和 流 式 视频 等 。Cerf 和 Kahn 预见 到 了 对 于 联网 协议 的 需求 ， 一 方面 为 行将 定义 
的 应 用 提供 广泛 的 支持 ， 另 一 方面 允许 任何 主机 与 链 路 层 协议 互 操作 ， 

2004 年 ，Cerf 和 Kahn 由 于 “联网 方面 的 开创 性 工作 (包括 因特网 的 基本 通信 协议 

TCP/IP 的 设计 和 实现 ) 以 及 联网 方面 富有 才能 的 领导 ”而 获得 ACM 图 灵 奖 ， 该 奖项 被 
| 认为 是 “计算 机 界 的 诺 贝 尔 奖 ”。 














这 种 TCP“ 连 接 ” 不 是 一 条 像 在 电路 交换 网 络 中 的 端 到 端 TDM 或 FDM HERR. FAR, 
该 “连接 ”是 一 条 逻辑 连接 ， 其 共同 状态 仅 保 留 在 两 个 通信 端 系 统 的 TCP 程序 中 。 前 面 
讲 过 ， 由 于 TCP 协议 只 在 端 系 统 中 运行 ， 而 不 在 中 间 的 网 络 元 素 (路 由 器 和 链 路 层 交 换 
机 ) 中 运行 ， WA 事实 上， 中 间 路 由 器 对 TCP 
连接 完全 视而不见 ， 它 们 看 到 的 是 数据 报 ， 


台 主 机 上 的 进程 B 存在 一 条 TCP 连接， 那么 应 用 层 数据 就 可 在 从 进程 B 流向 进程 A 的 同 
时 ， 也 从 进程 A 流向 进程 B。TCP 连接 也 总 是 点 对 点 (point-to-point) 的 ， 即 在 单个 发 送 
方 与 单个 接收 方 之 间 的 连接 。 所 谓 “ 多 播 ” (参见 本 书 的 在 线 补充 材料 )， 即 在 一 次 发 送 
操作 中 ， 从 一 个 发 送 方 将 数据 传送 给 多 个 接收 方 ， 这 种 情况 对 TCP 来 说 是 不 可 能 的 。 对 于 
TCP 而 言 ， 两 台 主 机 是 一 对 ， 而 3 台 主 机 则 太 多 了 ! 

我 们 现在 来 看 看 TCP 连接 是 怎样 建立 的 。 假 设 运行 在 某 台 主机 上 的 一 个 进程 想 与 另 一 
台 主 机 上 的 一 个 进程 建立 一 条 连接 。 前 面 讲 过 ， 发 起 连接 的 这 个 进程 被 称 为 客户 进程 ， 而 
男 一 个 进程 被 称 为 服务 器 进程 。 该 客户 应 用 进程 首先 要 通知 客户 运输 层 ， 它 想 与 服务 器 上 
的 一 个 进程 建立 一 条 连接 。2. 7. 2 节 讲 过 ， 一 个 Python 客户 程序 通过 发 出 下 面 的 命令 来 实 
现 此 目的 。 


clientSocket.connectl( (serverName, serverPort)) 


其 中 serverName 是 服务 器 的 名 字 ，serverPort 标识 了 服务 器 上 的 进程 。 客 户 上 的 TCP 
便 开 始 与 服务 器 上 的 TCP 建立 一 条 TCP 连接 。 我 们 将 在 本 节 后 面 更 为 详细 地 讨论 连接 建 
立 的 过 程 。 现 在 知道 下 列 事实 就 可 以 了 : 客户 首先 发 送 一 个 特殊 的 TCP 报 文 段 ， 服 务 髓 用 
男 一 个 特殊 的 TCP 报 文 段 来 啊 应 ， 最 后 ， 客 户 再 用 第 三 个 特殊 报 文 段 作为 响应 。 前 两 个 报 
文 段 不 承载 “有 效 载荷 ”， 也 就 是 不 包含 应 用 层 数据 ; 而 第 三 个 报 文 段 可 以 承载 有 效 载 集 。 
由 于 在 这 两 台 主 机 之 间 发 送 了 3 个 报 文 段 ， 所 以 这 种 连接 建立 过 程 常 被 称 为 三 次 握手 
(three- way handshake ) 。 

一 旦 建立 起 一 条 TCP 连接 ， 两 个 应 用 进程 之 间 就 可 以 相互 发 送 数据 了 。 我 们 考虑 一 下 
从 客户 进程 向 服务 器 进程 发 送 数 据 的 情况 。 如 2.7 节 中 所 述 ， 客 户 进程 通过 套 接 字 (该 进 
程 之 门 ) 传递 数据 流 。 数 据 一 旦 通过 该 门 ， 它 就 由 客户 中 运行 的 TCP 控制 了 。 如 图 3-28 
tax, TCP 将 这 些 数据 引导 到 该 连接 的 发 送 缓存 (send buffer) 里 ,发 送 缓存 是 发 起 三 次 
握手 期 间 设 置 的 缓存 之 一 。 接 下 来 TCP 就 会 不 时 从 发 送 缓存 里 取出 一 块 数据 ， 并 将 数据 传 
弟 到 网 络 层 。 有 趣 的 是 ， 在 TCP 规范 [RFC 793] 中 却 没 提 及 TCP 应 何 时 实际 发 送 缓存 里 
的 数据 ， 只 是 描述 为 “TCP 应 该 在 它 方便 的 时 候 以 报 文 段 的 形式 发 送 数 据 ”。TCP 可 从 组 
存 中 取出 并 放 入 报 文 段 中 的 数据 数量 受 限 于 最 大 报 文 段 长 度 (Maximum Segment Size, 
MSS). MSS 通常 根据 最 初 确定 的 由 本 地 发 送 主 机 发 送 的 最 大 链 路 层 帧 长 度 ( 即 所 谓 的 最 
大 传输 单元 (Maximum Transmission Unit, MTU)) 来 设置 。 设 置 该 MSS 要 保证 一 个 TCP 
报 文 段 ( 当 封 装 在 一 个 P 数据 报 中 ) 加 上 TCP/IP 首部 长 度 (通常 40 字 节 ) 将 适合 单个 
链 路 层 帧 。 以 太 网 和 PPP 链 路 层 协议 都 具有 1500 字 节 的 MTU, FA MSS 的 典型 值 为 1460 
字 节 。 已 经 提出 了 多 种 发 现 路 径 MTU 的 方法 ， 并 基于 路 径 MTU 值 设 置 MSS (路 径 MTU 
是 指 能 在 从 源 到 目的 地 的 所 有 链 路 上 发 送 的 最 大 链 路 层 帧 | RFC 1191 ] ) 。 注 意 到 MSS 是 
指 在 报 文 段 里 应 用 层 数 据 的 最 大 长 度 ， 而 不 是 指 包括 首部 的 TCP 报 文 段 的 最 大 长 度 。 (该 
术语 很 容易 混淆， 但 是 我 们 不 得 不 采用 它 ， 因 为 它 已 经 根深 蒂 固 了 ,) 

TCP 为 每 块 客户 数据 配 上 一 个 TCP 首部 ， 从 而 形成 多 个 TCP 报 文 段 (TCP segment) 。 
这 些 报 文 段 被 下 传 给 网 络 层 ， 网 络 层 将 其 分 别 封装 在 网 络 层 IP 数据 报 中 。 然 后 这 些 IP 数 
据 报 被 发 送 到 网 络 中 。 当 TCP 在 另 一 端 接收 到 一 个 报 文 段 后 ， 该 报 文 段 的 数据 就 被 放 人 该 
TCP 连接 的 接收 缓存 中 ， 如 图 3-28 中 所 示 。 应 用 程序 从 此 缓存 中 读 取 数据 流 。 该 连接 的 
每 一 端 都 有 各 上 自 的 发 送 缓存 和 接收 缓存 。 (读者 可 以 参见 http://www. awl. com/kurose- ross 
处 的 在 线 流 控制 Java 小 程序 ， 它 提供 了 关于 发 送 缓存 和 接收 缓存 的 一 个 动画 演示 。) 


154 RIFE 


进程 写 数据 


ERF 






进程 读 取 数 据 





图 3-28 TCP 发 送 缓存 和 接收 缓存 


从 以 上 讨论 中 我 们 可 以 看 出 ，TCP 连接 的 组 成 包括 : 一 台 主 机 上 的 缓存 、 变 量 和 与 进 
程 连接 的 套 接 字 ， 以 及 另 一 台 主 机 上 的 另 一 组 缓存 、 变 量 和 与 进程 连接 的 套 接 字 。 如 前 面 
讲 过 的 那样 ， 在 这 两 台 主 机 之 间 的 网 络 元 素 ( 路 由 右 、 交 换 机 和 中 继 胡 ) 中 ,没有 为 该 连 
接 分 配 任何 缓存 和 变量 。 


3.5.2 TCP 报 文 段 结构 


简要 地 了 解 了 TCP 连接 后 ， 我 们 研究 一 下 TCP 报 文 段 结构 。TCP 报 文 段 由 首部 字段 
和 -一 个 数据 字段 组 成 。 数 据 字段 包含 一 块 应 用 数据 。 如 前 所 述 ，MSS 限制 了 报 文 段 数据 字 
段 的 最 大 长 度 。 当 TCP 发 送 一 个 大 文件 ， 例 如 某 Web 页 面 上 的 一 个 图 像 时 ，TCP 通常 是 


将 该 文件 划分 成 长 度 为 MSS 的 若干 块 (最 32 比 特 

ARs, ERA MSs), A, = 
互 式 应 用 通常 传送 长 度 小 于 MSS 的 数据 块 。 wang 目的 端口 号 
例如 ， 对 于 像 Telnet 这 样 的 远程 登录 应 用 ， 轩 村 ys 


其 TCP 报 文 段 的 数据 字段 经 常 只 有 一 个 字 
节 。 由 于 TCP 的 首部 一 般 是 20 字 节 ( 比 
UDP 首部 多 12 字 节 ) ， 所 以 Telnet RAII DA MN Am posyaigë sin. 

文 段 也 许 只 有 21 字 节 长 。 因特网 检验 和 Rasen 


图 3-29 显示 了 TCP 报 文 段 的 结构 。 与 


UDP 一 样 ， 首 部 包括 源 端 口号 和 目的 端口 选项 

号 ， 它 被 用 于 多 路 复 用 /分 解 来 自 或 送 到 上 any 3 

层 应 用 的 数据 。 另 外 ， 同 UDP —#F, TCP 数据 
首部 也 包括 检验 和 字段 (checksum field) 。 

TCP 报 文 段 首部 还 包含 下 列 字段 : 图 3-29 TCP 报 文 段 结构 


e 32 比特 的 序号 字段 (sequence number field) 和 32 比特 的 确认 号 字段 (acknowl- 
edgment number field ) 。 这 些 字段 被 TCP 发 送 方 和 接收 方 用 来 实现 可 靠 数 据 传输 服 
务 ， 讨 论 见 后 。 

。 16 比特 的 接收 窗口 字段 (receive window field) ， 该 字段 用 于 流量 控制 。 我 们 很 快 
就 会 看 到 ， 该 字段 用 于 指示 接收 方 愿 意 接受 的 字 节 数量 。 

。 4 比特 的 首部 长 度 字段 (header length field) ， 该 字段 指示 了 以 32 比特 的 字 为 单位 
的 TCP 首部 长 度 。 由 于 TCP 选项 字段 的 原因 ，TCP 首部 的 长 度 是 可 变 的 。( 通 稼 ， 
选项 字段 为 空 ， 所 以 TCP 首部 的 典型 长 度 是 20 字 节 。) 


e 可 选 与 变 长 的 选项 字段 (options field) ， 该 字段 用 于 发 送 方 与 接收 方 协商 最 大 报 文 
段 长 度 (MSS) 时 ， 或 在 高 速 网 络 环 境 下 用 作 窗 口 调节 因子 时 使 用 。 首 部 字段 中 
还 定义 了 一 个 时 间 戳 选项。 可 参见 RFC 854 和 RFC 1323 了 解 其 他 细节 。 
© 6 比特 的 标志 字段 (flag field), ACK 比特 用 于 指示 确认 字段 中 的 值 是 有 效 的 ， 即 
该 报 文 段 包括 一 个 对 已 被 成 功 接收 报 文 段 的 确认 。RST、SYN 和 FIN 比特 用 于 连 
接 建立 和 拆除 ， 我 们 将 在 本 节 后 面 讨论 该 问题 。 在 明确 拥塞 通告 中 使 用 了 CWR 和 
ECE 比特 ， 如 3.7.2 节 中 讨论 的 那样 。 当 PSH 比特 被 置 位 时 ， 就 指示 接收 方 应 立 
即将 数据 交 给 上 层 。 最 后 ，URG 比特 用 来 指示 报 文 段 里 存在 着 被 发 送 端的 上 层 实 
体 置 为 “紧急 ”的 数据 。 紧 急 数据 的 最 后 一 个 字 节 由 16 比特 的 紧急 数据 指针 字段 
(urgent data pointer field) 指出 。 当 紧急 数据 存在 并 给 出 指向 紧急 数据 尾 指针 的 时 
候 ，TCP 必须 通知 接收 端的 上 层 实 体 。( 在 实践 中 ，PSH、URG 和 紧急 数据 指针 并 
没有 使 用 。 为 了 完整 性 起 见 ， 我 们 才 提 到 这 些 字段 。) 
作为 教师 的 经 验 是 ， 学 生 有 时 觉得 分 组 格式 的 讨论 相当 枯燥 ， 也 许 有 些 乏 味 。 特 别 是 
如 果 你 和 我 们 一 样 都 喜爱 乐高 玩具 ， 有 关 TC 首部 的 有 趣 和 新 颖 的 讨论 请 参见 [Pomeranz 
2010 ] 。 
1. 序号 和 确认 号 


TCP 报 文 段 首部 中 两 个 最 重要 的 字段 是 序号 字段 和 确认 号 字段 。 这 两 个 字段 是 TCP 可 
靠 传输 服务 的 关键 部 分 。 但 是 在 讨论 这 两 个 字段 是 如 何 用 于 提供 可 靠 数据 传输 之 前 ， 我 们 
首先 来 解释 一 下 TCP 在 这 两 个 字段 中 究竟 放置 了 什么 。 

TCP 把 数据 看 成 一 个 无 结构 的 、 有 序 的 字 节 流 。 我 们 从 TCP 对 序号 的 使 用 上 可 以 看 出 
这 一 点 ， 因 为 序号 是 建立 在 传送 的 字 节 流 之 上 ， 而 不 是 建立 在 传送 的 报 文 段 的 序列 之 上 。 
一 个 报 文 段 的 序号 (sequence number for a segment) 因此 是 该 报 文 段 首 字 节 的 字 节 流 编号 。 
举例 来 说 ， 假 设 主机 A 上 的 一 个 进程 想 通过 一 条 TCP 连接 向 主机 B 上 的 一 个 进程 发 送 一 
个 数据 流 。 主 机 A 中 的 TCP 将 隐 式 地 对 数据 流 中 的 每 一 个 字 节 编号 。 假 定数 据 流 由 一 
包含 500 000 字 节 的 文件 组 成 ， 其 MSS 为 1000 字 节 ， 数 据 流 的 首 字 节 编 号 是 0。 如 图 3-30 
tan, GH TCP 将 为 该 数据 流 构 建 500 个 报 文 段 。 给 第 一 个 报 文 段 分 配 序号 0， 第 二 个 报 文 

段 分 配 序号 1000， 第 三 个 报 文 段 分 配 序号 2000， 以 此 类 推 。 每 一 个 序号 被 填 人 到 相应 TCP 
报 文 段 首部 的 序号 字段 中 。 
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图 3-30 文件 数据 划分 成 TCP 报 文 段 


现在 我 们 考虑 一 下 确认 号 。 确 认 号 要 比 序号 难处 理 一 些 。 前 面 讲 过 ，TCP 是 全 双 工 的 ， 
因此 主机 A 在 向 主机 B 发 送 数据 的 同时 ， 也 许 也 接收 来 自主 机 B 的 数据 (都 是 同一 条 TCP 
连接 的 一 部 分 ) 。 从 主机 B 到 达 的 每 个 报 文 段 中 都 有 一 个 序号 用 于 从 B 流向 A 的 数据 。 主 机 
A 填充 进 报 文 段 的 确认 号 是 主机 A 期 望 从 主机 B 收 到 的 下 一 字 节 的 序号 。 看 一 些 例子 有 助 于 
理解 实际 发 生 的 事情 。 假 设 主机 A 已 收 到 了 来 自主 机 B 的 编号 为 0 ~535 的 所 有 字 节 ， 同 时 
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假设 它 打算 发 送 一 个 报 文 段 给 主机 B。 主 机 A 等 待 主机 B 的 数据 流 中 字 节 536 及 之 后 的 所 有 
字 节 。 所 以 主机 A 就 会 在 它 发 往 主机 B 的 报 文 段 的 确认 号 字段 中 填 上 536. 

再 举 一 个 例子 ， 假 设 主 机 A 已 收 到 一 个 来 自主 机 B 的 包含 字 节 0 ~ 535 的 报 文 段 ， 以 及 
男 一 个 包含 字 节 900 ~ 1000 的 报 文 段 。 由 于 某 种 原因 ， 主 机 A 还 没有 收 到 字 节 536 ~ 899 的 报 
文 段 。 在 这 个 例子 中 ， 主 机 A 为 了 重新 构建 主机 B 的 数据 流 ， 仍 在 等 待 字 节 536 ( 和 其 后 的 字 
节 )。 因 此 ，A 到 了 的 下 一 个 报 文 段 将 在 确认 号 字段 中 包含 336。 因 为 TCP 只 确认 该 流 中 至 第 一 
个 丢失 字 忆 为 止 的 字 节 ， 所 以 TCP 被 称 为 提供 累积 确认 (cumulative acknowledgment ) 。 

最 后 一 个 例子 也 会 引发 一 个 重要 而 微妙 的 问题 。 主 机 A 在 收 到 第 二 个 报 文 段 ( 字 节 
536 ~899) 之 前 收 到 第 三 个 报 文 段 (F 900 ~ 1000) 。 因 此 ， 第 三 个 报 文 段 失 序 到 达 。 
该 微妙 的 问题 是 : 当主 机 在 一 条 TCP 连接 中 收 到 失 序 报 文 段 时 该 怎么 办 ? 有 趣 的 是 ，TCP 
RFC 并 没有 为 此 明确 规定 任何 规则 ， 而 是 把 这 一 问题 留 给 实现 TCP 的 编程 人 员 去 处 理 。 他 
们 有 两 个 基本 的 选择 : 中 接收 方 立 即 丢弃 失 序 报 文 段 (如 前 所 述 ， 这 可 以 简化 接收 方 的 设 
it); @@ 接 收 方 保留 失 序 的 字 节 ， 并 等 待 缺 少 的 字 节 以 填补 该 间隔 。 显 然 ， 后 一 种 选择 对 
网 络 带 宽 而 言 更 为 有 效 ， 是 实践 中 采用 的 方法 。 

在 图 3-30 中 ， 我 们 假设 初始 序号 为 0。 事 实 上 ， 一 条 TCP 连接 的 双方 均 可 随机 地 选择 
初始 序号 。 这 样 做 可 以 减少 将 那些 仍 在 网 络 中 存在 的 来 自 两 台 主 机 之 间 先 前 已 终止 的 连接 
的 报 文 段 ， 误 认为 是 后 来 这 两 台 主 机 之 间 新 建 连 接 所 产生 的 有 效 报 文 段 的 可 能 性 ( 它 碰 巧 
与 旧 连 接 使 用 了 相同 的 端口 号 ) [Sunshine 1978 ] 。 

2. Telnet: 序号 和 确认 号 的 一 个 学 习 案 例 

Telnet 由 RFC 854 定义 ， 它 现在 是 一 个 用 于 远程 登录 的 流行 应 用 层 协议 。 它 运行 在 
TCP 之 上 ， 被 设计 成 可 在 任意 一 对 主机 之 间 工 作 。Telnet 与 我 们 第 2 章 讨论 的 批量 数据 传 
输 应 用 不 同 ， 它 是 一 个 交互 式 应 用 。 我 们 在 此 讨论 一 个 Telnet 例子 ， 因 为 该 例子 很 好 地 阐述 
TCP 的 序号 与 确认 号 。 我 们 注意 到 许多 用 户 现在 更 愿意 采用 SSH 协议 而 不 是 Telnet， 因 为 在 
Telnet 连接 中 发 送 的 数据 (包括 口令 !) 是 没有 加 密 的 ， 使 得 Telnet 易于 受到 窃听 攻击 (如 
在 8.7 节 中 讨论 的 那样 ) 。 主机 A 

假设 主机 A 发 起 一 个 与 主机 B 的 Tel- 

net 会 话 。 因 为 是 主机 A 发 起 该 会 话 ， 因 
此 它 被 标记 为 客户 ， 而 主机 B 被 标记 为 | 
服务 器 。( 在 客户 端的 ) 用 户 键入 的 每 个 MPRA IS, 
字符 都 会 被 发 送 至 远程 主机 ; 远程 主机 将 | D ae 
回 送 每 个 字符 的 副本 给 客户 ， 并 将 这 些 字 “~ 主机 确认 
符 显 示 在 Telnet 用 户 的 屏幕 上 。 这 种 “ 回 Pls eee 
fi” (echo back) 用 于 确保 由 Telnet 用 户 ; , : 
发 送 的 字符 已 经 被 远程 主机 收 到 并 在 远程 ai 
站 点 上 得 到 处 理 。 因 此 ， 在 从 用 户 击 键 到 收 到 回 显 : 
字符 被 显示 在 用 户 屏幕 上 这 段 时 间 内 ， 每 We Sag, 
个 字符 在 网 络 中 传输 了 两 次 。 

现在 假设 用 户 输 入 了 一 个 字符 'C'， ; $ 
然后 喝 起 了 咖啡 。 我 们 考察 一 下 在 客户 与 时 间 时 间 
服务 器 之 间 发 送 的 TCP 报 文 段 。 如 图 3-31 图 3-31 一 个 经 TCP 的 简单 Telnet 应 用 的 确认 号 和 序号 
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所 示 ， 假 设 客户 和 服务 器 的 起 始 序号 分 别 是 42 和 79。 前 面 讲 过 ， 一 个 报 文 段 的 序号 就 是 该 
报 文 段 数 据 字 段 首 字 节 的 序号 。 因 此 ， 客 户 发 送 的 第 一 个 报 文 段 的 序号 为 42， 服 务 器 发 送 
的 第 一 个 报 文 段 的 序号 为 79。 前 面 讲 过 ， 确 认 号 就 是 主机 正在 等 待 的 数据 的 下 一 个 字 节 序 
号 。 在 TCP 连接 建立 后 但 没有 发 送 任何 数据 之 前 ， 该 客户 等 待 字 节 79 ， 而 该 服务 器 等 待 
FH 42 。 

如 图 3-31 中 所 示 ， 共 发 送 3 个 报 文 段 。 第 一 个 报 文 段 是 由 客户 发 往 服务 硕 ， 在 它 的 
数据 字段 里 包含 一 字 节 的 字符 'C' 的 ASCH 码 。 如 我 们 刚 讲 到 的 那样 ， 第 一 个 报 文 段 的 序 
号 字段 里 是 42。 另 外 ， 由 于 客户 还 没有 接收 到 来 自 服务 器 的 任何 数据 ， 因 此 该 第 一 个 报 文 
段 中 的 确认 号 字段 中 是 79 。 

第 二 个 报 文 段 是 由 服务 器 发 往 客户 。 它 有 两 个 目的 : 首先 它 是 为 该 服务 器 所 收 到 数据 
提供 一 个 确认 。 通 过 在 确认 号 字段 中 填 人 43 ， 服 务 器 告诉 客户 它 已 经 成 功 地 收 到 字 节 42 
及 以 前 的 所 有 字 节 ， 现 在 正 等 待 着 字 节 43 的 出 现 。 该 报 文 段 的 第 二 个 目的 是 回 显 字符 
'C'。 因 此 ,在 第 二 个 报 文 段 的 数据 字段 里 填 和 人 的 是 字符 'C' 的 ASCI 码 。 第 二 个 报 文 段 
的 序号 为 79， 它 是 该 TCP 连接 上 从 服务 器 到 客户 的 数据 流 的 起 始 序 号 ， 这 也 正 是 服务 器 
要 发 送 的 第 一 个 字 节 的 数据 。 值 得 注意 的 是 ， 对 客户 到 服务 器 的 数据 的 确认 被 装载 在 一 个 
承载 服务 器 到 客户 的 数据 的 报 文 段 中 ; ROR BER AE RGR 〈piggybacked) 在 服务 器 
到 客户 的 数据 报 文 段 中 的 。 

第 三 个 报 文 段 是 从 客户 发 往 服务 器 的 。 它 的 唯一 目的 是 确认 已 从 服务 器 收 到 的 数据 。 
(前 面 讲 过 ， 第 二 个 报 文 段 中 包含 的 数据 是 字符 'C' ， 是 从 服务 器 到 客户 的 。) 该 报 文 段 的 
数据 字段 为 空 ( 即 确认 信息 没有 被 任何 从 客户 到 服务 器 的 数据 所 撒 带 )。 该 报 文 段 的 确认 
号 字段 填 人 的 是 80 ， 因 为 客户 已 经 收 到 了 字 节 流 中 序号 为 79 及 以 前 的 字 节 ， 它 现在 正 等 
待 着 字 节 80 的 出 现 。 你 可 能 认为 这 有 点 奇怪 ， 即 使 该 报 文 段 里 没有 数据 还 仍 有 序号 。 这 
是 因为 TCP 存在 序号 字段 ， 报 文 段 需要 填 人 某 个 序号 。 


3.5.3 往返 时 间 的 估计 与 超时 


TCP 如 同 前 面 3. 4 节 所 讲 的 rdt 协议 一 样 ， 它 采用 超时 / 重 传 机 制 来 处 理 报 文 段 的 丢失 问 
题 。 尽 管 这 在 概念 上 简单 ， 但 是 当 在 如 TCP 这 样 的 实际 协议 中 实现 超时 / 重 传 机 制 时 还 是 会 
产生 许多 微妙 的 问题 。 也 许 最 明显 的 一 个 问题 就 是 超时 间隔 长 度 的 设置 。 显 然 ， 超 时 间隔 必 
须 大 于 该 连接 的 往返 时 间 (RTT) ， 即 从 一 个 报 文 段 发 出 到 它 被 确认 的 时 间 。 否 则 会 造成 不 
必要 的 重 传 。 但 是 这 个 时 间 间 隅 到 底 应 该 是 多 大 呢 ? 刚 开 始 时 应 如 何 估 计 往 返 时 间 呢 ? AE AP 
应 该 为 所 有 未 确认 的 报 文 段 各 设 一 个 定时 器 ? 问题 竟然 如 此 之 多 ! 我 们 在 本 节 中 的 讨论 基于 
[ Jacobson 1988] 中 有 关 TCP 的 工作 以 及 IETF 关于 管理 TCP 定时 器 的 建议 [RFC 6298 ] 。 

1. 估计 往返 时 间 

我 们 开始 学 习 TCP 定时 器 的 管理 问题 ， 要 考虑 一 下 TCP 是 如 何 估计 发 送 方 与 接收 方 
之 间 往 返 时 间 的 。 这 是 通过 如 下 方法 完成 的 。 报 文 段 的 样本 RTT (表示 为 SampleRTT) 就 
是 从 某 报 文 段 被 发 出 ( 即 交 给 IP) 到 对 该 报 文 段 的 确认 被 收 到 之 间 的 时 间 量 。 大 多 数 TCP 
的 实现 仅 在 某 个 时 刻 做 一 次 SampleRTT 测量 ， 而 不 是 为 每 个 发 送 的 报 文 段 测量 一 个 Samp- 
leRTT。 这 就 是 说 ， 在 任意 时 刻 ， 仅 为 一 个 已 发 送 的 但 目前 尚未 被 确认 的 报 文 段 估计 Samp- 
leRTT， 从 而 产生 一 个 接近 每 个 RTT 的 新 SampleRTT 值 。 另 外 ，TCP 决 不 为 已 被 重 传 的 报 
文 段 计算 SampleRTT; 它 仅 为 传输 一 次 的 报 文 段 测量 SampleRTT [Kan 1987 ] 。( 本 章 后 面 
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的 一 个 习题 请 你 考虑 一 下 为 什么 要 这 么 做 。) 

显然 ， 由 于 路 由 需 的 拥塞 和 端 系 统 负载 的 变化 ， 这 些 报 文 段 的 SampleRTT 值 会 随 之 波 
动 。 由 于 这 种 波动 ， 任 何 给 定 的 SampleRTT 值 也 许 都 是 非典 型 的 。 因 此 ， 为 了 估计 一 个 典 
型 的 RIT, ASK AE XT SampleRTT 取 平 均 的 办 法 。TCP 维持 一 个 SampleRTT 均值 
( 称 为 EstimatedRTT)。 一 旦 获得 一 个 新 SampleRTT AY, TCP 就 会 根据 下 列 公 式 来 更 新 Esti- 
matedRTT : 

EstimatedRTT = (1 -—a@) + EstimatedRTT + a@ + SampleRTT 

上 面 的 公式 是 以 编程 语言 的 语句 方式 给 出 的 ， 即 EstimatedRTT 的 新 值 是 由 以 前 的 Esti- 
matedRTT 值 与 SampleRTT 新 值 加 权 组 合 而 成 的 。 在 [RFC 6298] 中 给 出 的 a 推荐 值 是 
a=0.125〈 即 1/8) ， 这 时 上 面 的 公式 变 为 : 

EstimatedRTT =0. 875 - EstimatedRTT +0. 125 .+ SampleRTT 

值得 注意 的 是 ，EstimatedRTT 是 一 个 SampleRTT 值 的 加 权 平 均值 。 如 在 本 章 后 面 习题 
中 讨论 的 那样 ， 这 个 加 权 平 均 对 最 近 的 样本 赋予 的 权 值 要 大 于 对 旧 样 本 赋予 的 权 值 。 这 是 
很 自然 的 ， 因 为 越 近 的 样本 越 能 更 好 地 反映 网 络 的 当前 拥塞 情况 。 从 统计 学 观点 讲 ， 这 种 
平均 被 称 为 指数 加 权 移 动 平 均 (Exponential Weighted Moving Average, EWMA), Æ EWMA 
中 的 “指数 ”一 词 看 起 来 是 指 一 个 给 定 的 SampleRTT 的 权 值 在 更 新 的 过 程 中 呈 指 数 型 快速 
衰减 。 在 课 后 习题 中 ， 将 要 求 你 推导 出 EstimatedRTT 的 指数 表达 形式 。 

图 3-32 显示 了 当 a =1/8 时 ， 在 gaia. cs. umass. edu (在 美国 马萨诸塞 州 的 Amherst) 
与 fantasia. eurecom. fr (在 法 国 南部 ) 之 间 的 一 条 TCP 连接 上 的 SampleRTT 值 与 Estimate- 
dRTT 值 。 显 然 ，SampleRTT 的 变化 在 EstimatedRTT 的 计算 中 趋 于 平缓 了 。 
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图 3-32 RTT 样 本 和 RTT 估计 


除了 估算 RIT Sb, 测量 RIT 的 变化 也 是 有 价值 的 。 [ RFC 6298] 定义 了 RIT 偏差 
DevRTT， 用 于 估算 SampleRTT 一 般 会 俩 离 EstimatedRTT 的 程度 ; 
DevRTT = (1-8) .+ DevRTT +B | SampleRTT ~ EstimatedRTT | 
注意 到 DevRTT 是 一 个 SampleRTT 45 EstimatedRTT 之 间 差 值 的 EWMA。 如 果 Samp- 
leRTT 值 波动 较 小 ， 那 么 DevRTT 的 值 就 会 很 小 ; 另 一 方面 ， 如 果 波 动 很 大 ， 那 么 DevRTT 
的 值 就 会 很 大 。B 的 推荐 值 为 0. 25. 


2. 设置 和 管理 重 传 超时 间隔 

假设 已 经 给 出 了 EstimatedRTT 值 和 DevRTT 值 ， 那 么 TCP 超时 间隔 应 该 用 什么 值 呢 ? 
很 明显 ， 超 时 间隔 应 该 大 于 等 于 EstimatedRTT， 否 则 ， 将 造成 不 必要 的 重 传 。 但 是 超时 间 
隔 也 不 应 该 比 EstimatedRTT 大 太 多 ， 否 则 当 报 文 段 丢失 时 ，TCP 不 能 很 快 地 重 传 该 报 文 
段 ， 导 致 数据 传输 时 延 大 。 因 此 要 求 将 超时 间隔 设 为 EstimatedRTT 加 上 一 定 余 量 。 当 
SampleRTT 值 波动 较 大 时 ， 这 个 余 量 应 该 大 些 ; 当 波 动 较 小 时 ， 这 个 余 量 应 该 小 些 。 因 
此 ，DevRTT 值 应 该 在 这 里 发 挥 作用 了 。 在 TCP 的 确定 重 传 超时 间隔 的 方法 中 ， 所 有 这 些 
因素 都 考虑 到 了 : 


TimeoutInterval = EstimatedRTT +4 - DevRTT 
推荐 的 初始 TimeoutInterval 值 为 1 秒 [ RFC 6298 |] 。 同 时 ， 当 出 现 超时 后 ，TimeoutInt- 
erval 值 将 加 倍 ， 以 免 即 将 被 确认 的 后 继 报 文 段 过 早出 现 超时 。 然 而 ， 只 要 收 到 报 文 段 并 更 
新 EstimatedRTT, ， 就 使 用 上 述 公 式 再 次 计算 TimeoutInterval。 

















与 我 们 在 3.4 节 中 所 学 的 方法 很 像 ，TCP 通过 使 用 肯定 确认 与 定时 器 来 提供 可 靠 数 
据 传输 。TCP 确认 正确 接收 到 的 数据 ， 而 当 认 为 报 文 段 或 其 确认 报 文 丢失 或 受 损 时 ， 
' TCP 会 重 传 这 些 报 文 段 。 有 些 版 本 的 TCP 还 有 一 个 隐 式 NAK HH) (A TCP 的 快速 重 传 
机制 下 ， 收 到 对 一 个 特定 报 文 段 的 3 个 宛 余 ACK 就 可 作为 对 后 面 报 文 段 的 一 个 隐 式 
NAK， 从 而 在 超时 之 前 触发 对 该 报 文 段 的 重 传 ) TCP 使 用 序号 以 使 接收 方 能 识别 丢失 
或 重复 的 报 文 段 。 像 可 靠 数 据 传输 协议 rdt3.0 的 情况 一 样 ，TCP 自己 也 无 法 明确 地 分 辨 
一 个 报 文 段 或 其 ACK 是 丢失 了 还 是 受 损 了 ， 或 是 时 延 过 长 了 。 在 发 送 方 ，TCP 的 响应 
| 是 相同 的 : 重 传 有 疑问 的 报 文 段 。 

TCP 也 使 用 流水 线 ， 使 得 发 送 方 在 任意 时 刻 都 可 以 有 多 个 已 发 出 但 还 未 被 确认 的 报 
文 段 存 在。 我 们 在 前 面 已 经 看 到 ， 当 报 文 段 长 度 与 往返 时 延 之 比 很 小 时 ， 流水线 可 显著 
地 增加 一 个 会 话 的 吞吐 量 。 一 个 发 送 方 能 够 具有 的 未 被 确认 报 文 段 的 具体 数量 是 由 TCP 
的 流量 控制 和 拥塞 控制 机 制 决定 的 。TCP 流量 控制 将 在 本 节 后 面 讨论 ; TCP 拥塞 控制 将 
在 3.7 节 中 讨论 。 此 时 我 们 只 需 知 道 TCP 发 送 方 使 用 了 流水 线 。 











3.5.4 可 靠 数 据 传输 


前 面 讲 过 ， 因 特 网 的 网 络 层 服务 (IP 服务 ) 是 不 可 靠 的 。IP 不 保证 数据 报 的 交付 ， 
不 保证 数据 报 的 按 序 交 付 ， 也 不 保证 数据 报 中 数据 的 完整 性 。 对 于 IP 服务 ， 数 据 报 能 够 
溢出 路 由 器 缓存 而 永远 不 能 到 达 目 的 地 ， 数 据 报 也 可 能 是 乱 序 到 达 ， 而 且 数 据 报 中 的 比特 
可 能 损坏 (由 0 变 为 1 或 者 相反 ) 。 由 于 运输 层 报 文 段 是 被 卫 数据 报 携带 着 在 网 络 中 传输 
的 ， 所 以 运输 层 的 报 文 段 也 会 遇 到 这 些 问题 。 

TCP 在 卫 不 可 靠 的 尽力 而 为 服务 之 上 创建 了 一 种 可 靠 数 据 传 输 服务 (reliable data 
transfer service) o TCP 的 可 靠 数据 传输 服务 确保 一 个 进程 从 其 接收 缓存 中 读 出 的 数据 流 是 
无 损坏 、 无 间隙 、 非 元 余 和 按 序 的 数据 流 ; 即 该 字 节 流 与 连接 的 另 一 方 端 系统 发 送出 的 字 
节 流 是 完全 相同 。TCP 提供 可 靠 数据 传输 的 方法 涉及 我 们 在 3.4 节 中 所 学 的 许多 原理 。 

在 我 们 前 面 研发 可 靠 数据 传输 技术 时 ， 曾 假定 每 一 个 已 发 送 但 未 被 确认 的 报 文 段 都 与 一 
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个 定时 器 相关 联 ， 这 在 概念 上 是 最 简单 的 。 虽 然 这 在 理论 上 很 好 ， 但 定时 器 的 管理 却 需要 相 
当 大 的 开销 。 因 此 ， 推 荐 的 定时 器 管理 过 程 [RFC 6298 ] 仅 使 用 单一 的 重 传 定时 器 ， 即 使 有 
多 个 已 发 送 但 还 未 被 确认 的 报 文 段 。 在 本 节 中 描述 的 TCP 协议 遵循 了 这 种 单一 定时 需 的 推荐 。 

我 们 将 以 两 个 递增 的 步骤 来 讨论 TCP 是 如 何 提供 可 靠 数 据 传输 的 。 我 们 先 给 出 一 个 TCP 
发 送 方 的 高 度 简化 的 描述 ， 该 发 送 方 只 用 超时 来 恢复 报 文 段 的 丢失 ; 然后 再 给 出 一 个 更 全 面 
的 描述 ， 该 描述 中 除了 使 用 超时 机 制 外 ， 还 使 用 元 余 确 认 技 术 。 在 接 下 来 的 讨论 中 ， RIE 
定数 据 仅 向 一 个 方向 发 送 ， 即 从 主机 A 到 主机 B， 且 主机 A 在 发 送 一 个 大 文件 。 

图 3-33 给 出 了 一 个 TCP 发 送 方 高 度 简化 的 描述 。 我 们 看 到 在 TCP 发 送 方 有 3 个 与 发 
送 和 重 传 有 关 的 主要 事件 : 从 上 层 应 用 程序 接收 数据 ; 定时 需 超 时 和 收 到 ACK, 一 旦 第 一 
个 主要 事件 发 生 ，TCP 从 应 用 程序 接收 数据 ， 将 数据 封装 在 一 个 报 文 段 中 ， 并 把 该 报 文 段 
交 给 P。 注 意 到 每 一 个 报 文 段 都 包含 一 个 序号 ， 如 3.5.2 节 所 讲 的 那样 ， 这 个 序号 就 是 该 
报 文 段 第 一 个 数据 字 节 的 字 节 流 编号 。 还 要 注意 到 如 果 定 时 器 还 没有 为 某 些 其 他 报 文 段 而 
运行 ， 则 当 报 文 段 被 传 给 IP 时 ，TCP 就 启动 该 定时 器 。( 将 定时 器 想象 为 与 最 早 的 未 被 确 
认 的 报 文 段 相 关联 是 有 帮助 的 。) 该 定时 器 的 过 期 间隔 是 TimeoutInterval ， 它 是 由 3. 3.3 市 
中 所 描述 的 EstimatedRTT 和 DevRTT 计算 得 出 的 。 

/* 假设 发 送 方 不 受 TCP 流 量 和 拥塞 控制 的 限制 ， 来 自 上 层 数 据 的 长 度 小 于 MSS， 且 数据 传送 只 在 -- 个 

方向 进行 。*/ 

NextSeqNum=InitialSeqNumber 

SendBase=InitialSeqNumber 

loop (永远 ) | 

switch (事件 ) 


BH: 从 上 面 应 用 程序 接收 到 数据 e 
生成 具有 序号 NextSeqNum 的 TCP 报 文 段 
if (定时 器 当前 没有 运行 ) 
启动 定时 器 
向 IP 传 递 报 文 段 
NextSeqNum=NextSeqNum+length (data) 


break; 


事件 : 定时 器 超时 
重 传 具有 最 小 序号 但 仍 未 应 答 的 报 文 段 
启动 定时 器 
break; 
事件 : 收 到 ACK， 具有 ACK 字 段 值 y 
if (y > SendBase) { 
SendBase=y 
if (当前 仍 无 任何 应 答 报 文 段 ) 
启动 定时 器 


break; 





} /* 结束 永远 循环 */ 


图 3-33 简化 的 TCP 发 送 方 


第 二 个 主要 事件 是 超时 。TCP 通过 重 传 引起 超时 的 报 文 段 来 啊 应 超时 事件 。 然 后 TCP 
EJA ERAF o 


TCP 发 送 方 必须 处 理 的 第 三 个 主要 事件 是 ， 到 达 一 个 来 自 接收 方 的 确认 报 文 段 (ACK ) 
(更 确切 地 说 ， 是 一 个 包含 了 有 效 ACK 字段 值 的 报 文 段 ) 。 当 该 事件 发 生 时 ，TCP 将 ACK 的 
{A y 与 它 的 变量 SendBase 进行 比较 。TCP 状态 变量 SendBase 是 最 早 未 被 确认 的 字 节 的 序号 。 
(因此 SendBase -1 是 指 接收 方 已 正确 按 序 接收 到 的 数据 的 最 后 一 个 字 节 的 序号 。) 如 前 面 指 
出 的 那样 ，TCP 采用 累积 确认 ， 所 以 y 确认 了 字 节 编号 在 y 之 前 的 所 有 字 节 都 已 经 收 到 。 如 
R y >SendBase ， 则 该 ACK 是 在 确认 一 个 或 多 个 先前 未 被 确认 的 报 文 段 。 因 此 发 送 方 更 新 它 
的 SendBase 变量 ; 如 果 当 前 有 未 被 确认 的 报 文 段 ，TCP 还 要 重新 启动 定时 需 。 

1. 一 些 有 趣 的 情况 

我 们 刚刚 描述 了 一 个 关于 TCP 如 何 提供 可 靠 数据 传输 的 高 度 简化 的 版 本 。 但 即使 这 种 
高 度 简 化 的 版 本 ， 仍 然 存在 着 许多 微妙 之 处 。 为 了 较 好 地 感受 该 协议 的 工作 过 程 ， 我 们 来 
看 几 种 简单 情况 。 图 3-34 描述 了 第 一 种 情况 ， 主 机 A 回 主 机 B 发 送 一 个 报 文 段 。 假 设 该 
报 文 段 的 序号 是 92， 而且 包含 8 字 节 数据 。 在 发 出 该 报 文 段 之 后 ， 主 机 A 等 待 一 个 来 目 
主机 B 的 确认 号 为 100 的 报 文 段 。 虽 然 A 发 出 的 报 文 段 在 主机 B 上 被 收 到 ， 但 从 主机 B 
发 往 主机 A 的 确认 报 文 丢失 了 。 在 这 种 情况 下 ， 超 时 事件 就 会 发 生 ， 主 机 A 会 重 传 相同 
的 报 文 段 。 当 然 ， 当 主机 B 收 到 该 重 传 的 报 文 段 时 ， 它 将 通过 序号 发 现 该 报 文 段 包含 了 早 
已 收 到 的 数据 。 因 此 ， 主 机 B 中 的 TCP 将 丢弃 该 重 传 的 报 文 段 中 的 这 些 字 节 。 

在 第 二 种 情况 中 ， 如 图 3-35 Aras, ESL A 连续 发 回 了 两 个 报 文 段 。 第 一 个 报 文 段 序号 
是 92， 包含 8 字 节 数据 ; 第 二 个 报 文 段 序号 是 100， 包含 20 字 节 数据 。 假 设 两 个 报 文 段 都 完 
好 无 损 地 到 达 主 机 B， 并 且 主 机 B 为 每 一 个 报 文 段 分 别 发送 一 个 确认 。 第 一 个 确认 报 文 的 确 
认 号 是 100， 第 二 个 确认 报 文 的 确认 号 是 120。 现 在 假设 在 超时 之 前 这 两 个 报 文 段 中 没有 一 个 
确认 报 文 到 达 主 机 A。 当 超时 事件 发 生 时 ,主机 A EFS 92 的 第 一 个 报 文 段 ， 并 重启 定 
时 器 。 只 要 第 二 个 报 文 段 的 ACK 在 新 的 超时 发 生 以 前 到 达 ， 则 第 二 个 报 文 段 将 不 会 被 重 传 。 

主机 A 主机 B 





超时 -| : 0 : 
’ Y 
时 间 时 间 时 间 时 间 
图 3-34 ”由 于 确认 丢失 而 重 传 图 3-35 ” 报 文 段 100 没有 重 传 


在 第 三 种 也 是 最 后 一 种 情况 中 ， 假 设 主机 A 与 在 第 二 种 情况 中 完全 一 样 ， 发 送 两 个 报 
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文 段 。 第 一 个 报 文 段 的 确认 报 文 在 网 络 丢 失 ， 但 在 超时 事件 发 生 之 前 主机 A 收 到 一 个 确认 
号 为 120 的 确认 报 文 。 主 机 A 因而 知道 主机 B 已 经 收 到 了 序号 为 119 及 之 前 的 所 有 字 节 ; 
所 以 主机 A 不 会 重 传 这 两 个 报 文 段 中 的 任何 主机 A 主机 B 
一 个 。 这 种 情况 在 图 3-36 中 进行 了 图 示 。 
2. 超时 间隔 加 倍 = 
我 们 现在 讨论 一 下 在 大 多 数 TCP 实现 中 SG- 
所 做 的 一 些 修改 。 首 先 关注 的 是 在 定时 器 时 : 
限 过 期 后 超时 间隔 的 长 度 。 在 这 种 修改 中 ， 





每 当 超 时 事件 发 生 时 ， 如 前 所 述 ，TCP 重 传 > 
具有 最 小 序号 的 还 未 被 确认 的 报 文 段 。 只 是 ; (丢失) 


每 次 TCP 重 传 时 都 会 将 下 一 次 的 超时 间隔 设 ”超时 间隔 | : ee : 
为 先前 值 的 两 倍 ， 而 不 是 用 从 EstimatedRTT : : 
和 DevRTT 推算 出 的 值 (如 在 3.5.3 市 中 所 ; ; 
描述 的 ) 。 例 如 ， 假 设 当 定时 器 第 一 次 过 期 
时 ， 与 最 早 的 未 被 确认 的 报 文 段 相 关联 的 
TimeoutInterval 是 0.75 秒 。TCP 就 会 重 传 该 
报 文 段 ， 并 把 新 的 过 期 时 间 设 置 为 1.5 秒 。 $ $ 
如 果 1.5 秒 后 定时 器 又 过 期 了 ， 则 TCP 将 再 时 间 时 间 
次 重 传 该 报 文 段 ， 并 把 过 期 时 间 设 置 为 3.0 图 3-36 累积 确认 避免 了 第 一 个 报 文 段 的 重 传 
秒 。 因 此 ， 超 时 间隔 在 每 次 重 传 后 会 呈 指 数 型 增长 。 然 而 ， 每 当 定时 器 在 另 两 个 事件 (E 
收 到 上 层 应 用 的 数据 和 收 到 ACK) 中 的 任意 一 个 启动 时 ，TimeoutInterval 由 最 近 的 Estimat- 
edRTT 值 与 DevRTT 值 推算 得 到 。 

这 种 修改 提供 了 一 个 形式 受 限 的 拥塞 控制 。( 更 复杂 的 TCP 拥塞 控制 形式 将 在 3.7 市 
中 学 习 。) 定时 器 过 期 很 可 能 是 由 网 络 拥塞 引起 的 ， 即 太 多 的 分 组 到 达 源 与 目的 地 之 间 路 
径 上 的 一 台 (MBA) 路 由 器 的 队列 中 ,造成 分 组 丢失 或 长 时 间 的 排队 时 延 。 在 拥塞 的 时 
候 ， 如 果 源 持续 重 传 分 组 ， 会 使 拥塞 更 加 严重 。 相 反 ，TCP 使 用 更 文雅 的 方式 ， 每 个 发 送 
方 的 重 传 都 是 经 过 越 来 越 长 的 时 间 间 隔 后 进行 的 。 当 我 们 在 第 6 章 学 习 CSMA/CD 时 ,将 
看 到 以 太 网 采用 了 类 似 的 思路 。 

3. 快速 重 传 


超时 触发 重 传 存 在 的 问题 之 一 是 超时 周期 可 能 相对 较 长 。 当 一 个 报 文 段 丢失 时 ， 
这 种 长 超时 周期 迫使 发 送 方 延 人 运 重 传 丢失 的 分 组 ， 因 而 增加 了 端 到 端 时 延 。 辫 运 的 
是 ， 发 送 方 通常 可 在 超时 事件 发 生 之 前 通过 注意 所 谓 元 余 ACK 来 较 好 地 检测 到 丢 包 
情况 。 宛 余 ACK (duplicate ACK) 就 是 再 次 确认 某 个 报 文 段 的 ACK， 而 发 送 方 先前 
已 经 收 到 对 该 报 文 段 的 确认 。 要 理解 发 送 方 对 元 余 ACK 的 啊 应 ， 我 们 必须 首先 看 一 
下 接收 方 为 什么 会 发 送 元 余 ACK。 表 3-2 总 结 了 TCP 接收 方 的 ACK 生成 策略 [RFC 
5681 ] 。 当 TCP 接收 方 收 到 一 个 具有 这 样 序号 的 报 文 段 时 ， 即 其 序号 大 于 下 一 个 所 期 
望 的 、 按 序 的 报 文 段 ， 它 检测 到 了 数据 流 中 的 一 个 间 阳 ， 这 就 是 说 有 报 文 段 丢失 。 这 
个 间隔 可 能 是 由 于 在 网 络 中 报 文 段 丢失 或 重新 排序 造成 的 。 因 为 TCP 不 使 用 否定 确 
认 ， 所 以 接收 方 不 能 向 发 送 方 发 回 一 个 显 式 的 否定 确认 。 相 反 ， 它 只 是 对 已 经 接收 到 
的 最 后 一 个 按 序 字 节 数 据 进 行 重复 确认 〈 即 产生 一 个 元 余 ACK) 即 可 。 (注意 到 在 


K 3-2 中 人 允许 接收 方 不 丢弃 失 序 报 文 段 。) 


表 3-2 产生 TCP ACK 的 建议 [RFC 5681 ] 
事件 TCP 接收 方 动作 

具有 所 期 望 序号 的 按 序 报 文 段 到 达 。 所 延迟 的 ACK。 对 男 一 个 按 序 报 文 段 的 到 达 最 多 等 待 500ms。 如 果 下 
有 在 期 望 序 号 及 以 前 的 数据 都 已 经 被 确认 ”| 一 个 按 序 报 文 段 在 这 个 时 间 间 隔 内 没有 到 达 ， 则 发 送 一 个 ACK 

具有 所 期 望 序号 的 按 序 报 文 段 到 达 。 男 立即 发 送 单个 累积 ACK， 以 确认 两 个 按 序 报 文 段 
一 个 按 序 报 文 段 等 待 ACK 传输 

比 期 望 序号 大 的 失 序 报 文 段 到 达 。 检 测 立即 发 送 元 余 ACK， 指 示 下 一 个 期 待 字 节 的 序号 (其 为 间隔 的 低 端 
出 间隔 的 序号 ) 


能 部 分 或 完全 填充 接收 数据 间隔 的 报 文 倘若 该 报 文 段 起 始 于 间隔 的 低 端 ， 则 立即 发 送 ACK 
段 到 达 


因为 发 送 方 经 常 一 个 接 一 个 地 发 送 大 量 的 报 文 段 ， 如 果 一 个 报 文 段 丢 失 ， 就 很 可 能 引 
起 许多 一 个 接 一 个 的 元 余 ACK。 如 果 TCP 发 送 方 接收 到 对 相同 数据 的 3 个 元 余 ACK, € 
把 这 当 作 一 种 指示 ， 说 明 跟 在 这 个 已 被 确认 过 3 次 的 报 文 段 之 后 的 报 文 段 已 经 丢失 。 (在 
课 后 习题 中 ， 我 们 将 考虑 为 什么 发 送 方 等 待 3 个 宛 余 ACK， 而 不 是 仅仅 等 待 一 个 元 余 
ACK,) 一 旦 收 到 3 个 匈 余 ACK, TCP 就 执行 快速 重 传 (fast retransmit) | RFC 5681], ， 即 
在 该 报 文 段 的 定时 器 过 期 之 前 重 传 丢 失 的 报 文 段 。 对 于 采用 快速 重 传 的 TCP， 可 用 下 列 代 
人 码 片 段 代 蔡 图 3-33 中 的 ACK 收 到 事件 : 
事件 : 收 到 ACK, 具有 ACK 字 段 值 y 
if (y > SendBase) { 
SendBase=y 
1f (当前 仍 无 任何 应 答 报 文 段 ) 
启动 定时 器 
ae {/* 对 已 经 确认 的 报 文 段 的 一 个 元 余 ACK * / 
对 y 收 到 的 宛 余 ACK 数 加 1 
1f (对 y==3 收 到 的 宛 余 ACK 数 ) 
/* TCP 快 速 重 传 */ 
重新 发 送 具有 序号 y 的 报 文 段 


} 
break; 


前 面 讲 过 ， 当 在 如 TCP 这 样 一 个 实际 协议 中 实现 超时 / 重 传 机 制 时 ， 会 产生 许多 微妙 
的 问题 。 上 面 的 过 程 是 在 超过 20 年 的 TCP 定时 器 使 用 经 验 的 基础 上 演化 而 来 的 ， 读 者 应 
当 理 解 实际 情况 确实 是 这 样 的 。 

4. 是 回 退 N 步 还 是 选择 重 传 

考虑 下 面 这 个 问题 来 结束 有 关 TCP 差错 恢复 机 制 的 学 习 : TCP 是 一 个 CBN 协议 还 是 
一 个 SR 协议 ?前 面 讲 过 ，TCP 确认 是 累积 式 的 ， 正 确 接收 但 失 序 的 报 文 段 是 不 会 被 接收 
方 逐 个 确认 的 。 因 此 ， 如 图 3-33 所 示 (也 可 参见 图 3-19) TCP 发 送 方 仅 需 维持 已 发 送 过 
但 未 被 确认 的 字 节 的 最 小 序号 ( SendBase) 和 下 一 个 要 发 送 的 字 节 的 序号 
(NextSeqNum) 。 在 这 种 意义 下 ，TCP 看 起 来 更 像 一 个 CBN 风格 的 协议 。 但 是 TCP 和 CBN 
协议 之 间 有 着 一 些 显 著 的 区 别 。 许 多 TCP 实现 会 将 正确 接收 但 失 序 的 报 文 段 缓存 起 来 
[ Stevens 1994 ] 。 另 外 考虑 一 下 ， 当 发 送 方 发 送 的 一 组 报 文 段 1，2，…，MN， 并 且 所 有 的 
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报 文 段 都 按 序 无 差错 地 到 达 接 收 方 时 会 发 生 的 情况 。 进 一 步 假 设 对 分 组 nm< N 的 确认 报 文 
丢失 ， 但 是 其 余 N -1 个 确认 报 文 在 分 别 超时 以 前 到 达 发 送 端 ， 这 时 又 会 发 生 的 情况 。 在 
该 例 中 ，GBN 不 仅 会 重 传 分 组 n， 还 会 重 主机 A 主机 B 


传 所 有 后 继 的 分 组 n+1, +2，…，N。 
在 男 一 方面 ，TCP 将 重 传 至 多 一 个 报 文 
段 ， 即 报 文 段 mw。 此 外 ， 如 果 对 报 文 段 + 
1 的 确认 报 文 在 报 文 段 n 超时 之 前 到 达 ， 
TCP 甚至 不 会 重 传 报 文 段 n。 

对 TCP 提出 的 一 种 修改 意见 是 所 谓 的 
选择 确认 (selective acknowledgment) | RFC 
2018] ， 它 允许 TCP 接收 方 有 选择 地 确认 
失 序 报 文 段 ， 而 不 是 累积 地 确认 最 后 一 个 
正确 接收 的 有 序 报 文 段 。 当 将 该 机 制 与 选 
择 重 传 机 制 结合 起 来 使 用 时 ( 即 跳 过 重 传 
那些 已 被 接 收 方 选择 性 地 确认 过 的 报 文 
段 ) TCP 看 起 来 就 很 像 我 们 通常 的 SR 协 ”超时 






* ack=100 


*ack=100 
. ack=100 
“ack=100 


Segs 
议 。 因 此 ，TCP 的 差错 恢复 机 制 也 许 最 好 Co 
被 分 类 为 CBN 协议 与 SR 协议 的 混合 体 。 = 
3.5.5 流量 控制 
y y 

前 面 讲 过 ， 一 条 TCP 连接 的 每 一 侧 主 时 间 时 间 
机 都 为 该 连接 设置 了 接收 缓存 。 当 该 TCP 图 3-37 快速 重 传 : 在 某 报 文 段 的 定时 器 过 期 
连接 收 到 正确 、 按 序 的 字 节 后 ， 它 就 将 数 SHWE BA AIR E 


据 放 入 接收 缓存 。 相 关联 的 应 用 进程 会 从 该 缓存 中 读 取 数据 ， 但 不 必 是 数据 刚 一 到 达 就 立 
即 读 取 。 事 实 上 ， 接 收 方 应 用 也 许 正 忙于 其 他 任务 ， 甚 至 要 过 很 长 时 间 后 才 去 读 取 该 数 
据 。 如 果 某 应 用 程序 读 取 数据 时 相对 缓慢 ， 而 发 送 方 发 送 得 太 多 、 太 快 ， 发 送 的 数据 就 会 
很 容易 地 使 该 连接 的 接收 缓存 溢出 。 

TCP 为 它 的 应 用 程序 提供 了 流量 控制 服务 (flow- control service) 以 消除 发 送 方 使 接收 
方 缓存 溢出 的 可 能 性 。 流 量 控制 因此 是 一 个 速度 匹配 服务 ， 即 发 送 方 的 发 送 速率 与 接收 方 
应 用 程序 的 读 取 速 率 相 匹配 。 前 面 提 到 过 ，TCP 发 送 方 也 可 能 因为 IP 网 络 的 拥塞 而 被 过 
制 ; 这 种 形式 的 发 送 方 的 控制 被 称 为 拥塞 控制 (congestion control) ， 我 们 将 在 3.6 节 和 
3.7 节 详 细 地 讨论 这 个 主题 。 即 使 流量 控制 和 拥塞 控制 采取 的 动作 非常 相似 (对 发 送 方 的 
遏制 ) ， 但 是 它们 显然 是 针对 完全 不 同 的 原因 而 采取 的 措施 。 不 幸 的 是 ， 许 多 作者 把 这 两 
个 术语 混用 ， 理 解 力 强 的 读者 会 明智 地 区 分 这 两 种 情况 。 现 在 我 们 来 讨论 TCP 如 何 提供 流 
量 控制 服务 的 。 为 了 能 从 整体 上 看 问题 ， 我 们 在 本 节 都 假设 TCP 是 这 样 实现 的 ， 即 TCP 
接收 方 丢弃 失 序 的 报 文 段 。 

TCP 通过 让 发 送 方 维护 一 个 称 为 接收 窗口 (receive window) 的 变量 来 提供 流量 控制 。 
通俗 地 说 ， 接 收 窗 口 用 于 给 发 送 方 一 个 指示 一 一 该 接收 方 还 有 和 多少 可 用 的 缓存 空间 。 因 为 
TCP 是 全 双 工 通信 ， 在 连接 两 端的 发 送 方 都 各 自 维护 一 个 接收 窗口 。 我 们 在 文件 传输 的 情 
况 下 研究 接收 窗口 。 假 设 主机 A 通过 一 条 TCP 连接 向 主机 B 发 送 一 个 大 文件 。 主 机 B 为 
该 连接 分 配 了 一 个 接收 缓存 ， 并 用 RevBuffer 来 表示 其 大 小 。 主 机 B 上 的 应 用 进程 不 时 地 





从 该 缓存 中 读 取 数据 。 我 们 定义 以 下 变量 : 

e LastByteRead: 主机 B 上 的 应 用 进程 从 缓存 读 出 的 数据 流 的 最 后 一 个 字 节 的 编号 。 

e LastByteRcvd: 从 网 络 中 到 达 的 并 且 已 放 入 主机 B 接收 缓存 中 的 数据 流 的 最 后 一 个 

字 节 的 编号 。 
由 于 TCP 不 允许 已 分 配 的 缓存 溢出， 下 式 必 须 成 立 : 
LastByteRcvd - LastByteRead < RevBuffer 
接收 窗口 用 rwnd 表示 ， 根 据 缓存 可 用 空间 的 数量 来 设置 : 
rwnd = RevBuffer — | LastByteRcvd - LastByteRead | 

由 于 该 空间 是 随 着 时 间 变 化 的 ， 所 以 rwnd 是 动态 的 。 图 3-38 对 变量 rwnd 进行 了 
图 示 。 

连接 是 如 何 使 用 变量 rwnd 来 提供 流 
量 控制 服务 的 呢 ? 主机 B 通过 把 当前 的 
rwnd 值 放 入 它 发 给 主机 A 的 报 文 段 接收 
窗口 字段 中 ， 通 知 主机 A 它 在 该 连接 的 组 
存 中 还 有 多 少 可 用 空间 。 开 始 时 ,主机 B 
设 定 rwnd = RevBuffer。 注 意 到 为 了 实现 这 
一 点 ， 主 机 B 必须 跟 踊 几 个 与 连接 有 关 的 
变量 。 图 3-38 接收 窗口 (rwnd) 和 接收 缓存 (RevBuffer) 

主机 A 轮流 跟踪 两 个 变量 ，LastByteSent 和 LastByteAcked， 这 两 个 变量 的 意义 很 明显 。 
注意 到 这 两 个 变量 之 间 的 差 LastByteSent - LastByteAcked ， 就 是 主机 A 发 送 到 连接 中 但 未 
被 确认 的 数据 量 。 通 过 将 未 确认 的 数据 量 控制 在 值 rvnd 以 内 ， 就 可 以 保证 主机 A 不 会 使 
主机 B 的 接收 缓存 溢出 。 因 此 ， 主 机 A 在 该 连接 的 整个 生命 周期 须 保证 : 

LastByteSent - LastByteAcked <rwnd 

对 于 这 个 方案 还 存在 一 个 小 小 的 技术 问题 。 为 了 理解 这 一 点 ， 假 设 主 机 B 的 接收 组 
存 已 经 存 满 ， 使 得 rwnd =0。 在 将 rwnd =0 通告 给 主机 A 之 后 ， 还 要 假设 主机 了 B 没有 任 
何 数据 要 发 给 主机 A。 此 时 ， 考 虑 会 发 生 什么 情况 。 因 为 主机 B 上 的 应 用 进程 将 缓存 清 
空 ，TCP 并 不 向 主机 A 发 送 带 有 rwnd 新 值 的 新 报 文 段 ; EKE, TCP 仅 当 在 它 有 数据 
或 有 确认 要 发 时 才 会 发 送 报 文 段 给 主机 A。 这 样 ， 主 机 A 不 可 能 知道 主机 B 的 接收 缓存 
已 经 有 新 的 空间 了 ， 即 主机 A 被 阻塞 而 不 能 再 发 送 数据 ! 为 了 解决 这 个 问题 ，TCP 规范 
中 要 求 : 当主 机 B 的 接收 窗口 为 0 时 ， 主 机 A 继续 发 送 只 有 一 个 字 节 数据 的 报 文 段 。 这 
些 报 文 段 将 会 被 接收 方 确认 。 最 终 缓存 将 开始 清空 ， 并 且 确 认 报 文 里 将 包含 一 个 非 0 的 
rwnd 值 。 

位 于 http://www. awl. com/kurose- ross 的 在 线 站 点 为 本 书 提供 了 一 个 交互 式 Java 小 程 
序 ， 用 以 说 明 TCP 接收 窗口 的 运行 情况 。 

描述 了 TCP 的 流量 控制 服务 以 后 ,我 们 在 此 要 简要 地 提 一 下 UDP 并 不 提供 流量 控制 ， 
报 文 段 由 于 缓存 溢出 可 能 在 接收 方 丢 失 。 例 如 ， 考 虑 一 下 从 主机 A 上 的 一 个 进程 向 主机 B 
上 的 一 个 进程 发 送 一 系列 UDP 报 文 段 的 情形 。 对 于 一 个 典型 的 UDP 实现 ，UDP 将 在 一 个 
有 限 大 小 的 缓存 中 加 上 报 文 段 ， 该 缓存 在 相应 套 接 字 (进程 的 门户 ) “之 前 ”。 进 程 每 次 
从 缓存 中 读 取 一 个 完整 的 报 文 段 。 如 果 进 程 从 缓存 中 读 取 报 文 段 的 速度 不 够 快 ， 那么 缓存 
将 会 溢出 ， 并 且 将 丢失 报 文 段 。 


RecvBuffer 





rwnd 





166 #3 Ž 


3.5.6 TCP 连接 管理 


在 本 小 节 中 ， 我 们 更 为 仔细 地 观察 如 何 建立 和 拆除 一 条 TCP 连接 。 尽 管 这 个 主题 并 不 
特别 令 人 兴奋 ， 但 是 它 很 重要 ， 因 为 TCP 连接 的 建立 会 显著 地 增加 人 们 感受 到 的 时 延 
(如 在 Web 上 冲浪 时 ) 。 此 外 ， 许 多 常见 的 网 络 攻击 (包括 极为 流行 的 SYN 洪 泛 攻击 ) 利 
用 了 TCP 连接 管理 中 的 弱点 。 现 在 我 们 观察 一 下 一 条 TCP 连接 是 如 何 建立 的 。 假 设 运行 
在 一 台 主 机 (客户 ) 上 的 一 个 进程 想 与 男 一 台 主 机 (服务器) 上 的 一 个 进程 建立 一 条 连 
接 。 客 户 应 用 进程 首先 通知 客户 TCP， 它 想 建 立 一 个 与 服务 器 上 某 个 进程 之 间 的 连接 。 客 
户 中 的 TCP 会 用 以 下 方式 与 服务 器 中 的 TCP 建立 一 条 TCP 连接 : 
e 第 一 步 : 客户 端的 TCP 首先 向 服务 器 端的 TCP 发 送 一 个 特殊 的 TCP 报 文 段 。 该 报 
文 段 中 不 包含 应 用 层 数据 。 但 是 在 报 文 段 的 首部 (参见 图 3-29) 中 的 一 个 标志 位 
(BU SYN 比特 ) 被 置 为 1。 因 此 ， 这 个 特殊 报 文 段 被 称 为 SYN 报 文 段 。 另 外 ， 客 
户 会 随机 地 选择 一 个 初始 序号 ( client_isn) ， 并 将 此 编号 放置 于 该 起 始 的 TCP SYN 
报 文 段 的 序号 字段 中 。 该 报 文 段 会 被 封装 在 一 个 IP ARP, FF AIK GIR HR. 
为 了 避免 某 些 安全 性 攻击 ， 在 适当 地 随机 化 选择 client_isn 方面 有 着 不 少 有 趣 的 研 
究 [CERT 2001-09 | 。 

© 第 二 步 : 一 旦 包含 TCP SYN 报 文 段 的 了 P 数据 报到 达 服 务 器 主机 (假定 它 的 确 到 达 
了 !)， 服 务 器 会 从 该 数据 报 中 提取 出 TCP SYN 报 文 段 ， 为 该 TCP 连接 分 配 TCP 组 
存 和 变量 ， 并 向 该 客户 TCP 发 送 允 许 连 接 的 报 文 段 。( 我 们 将 在 第 8 章 看 到 ， 在 完 
成 三 次 握手 的 第 三 步 之 前 分 配 这 些 缓存 和 变量 ,使 得 TCP 易于 受到 称 为 SYN W 
的 拒绝 服务 攻击 。) 这 个 允许 连接 的 报 文 段 也 不 包含 应 用 层 数据 。 但 是 ， 在 报 文 段 
的 首部 却 包含 3 个 重要 的 信息 。 首 先 ，SYN 比特 被 置 为 1。 其 次 ， 该 TCP 报 文 段 
首部 的 确认 号 字段 被 置 为 client _isn + 1。 最后， 服务器 选择 自己 的 初始 序号 
(server_isn) ， 并 将 其 放置 到 TCP 报 文 段 首 部 的 序号 字段 中 。 这 个 允许 连接 的 报 文 
段 实 际 上 表明 了 :“ 我 收 到 了 你 发 起 建立 连接 的 SYN 分 组 ， 该 分 组 带 有 初始 序号 
client_isn。 我 同意 建立 该 连接 。 我 自己 的 初始 序号 是 server_isn。” 该 允许 连接 的 报 
文 段 被 称 为 SYNACK 报 文 段 (SYNACK segment) ) 。 

© 第 三 步 : 在 收 到 SYNACK 报 文 段 后 ， 客 户 也 要 给 该 连接 分 配 缓存 和 变量 。 客 户主 
机 则 向 服务 器 发 送 男 外 一 个 报 文 段 ; 这 最 后 一 个 报 文 段 对 服务 器 的 允许 连接 的 报 
文 段 进行 了 确认 (该 客户 通过 将 值 server_isn + 1 放置 到 TCP 报 文 段 首部 的 确认 字 
段 中 来 完成 此 项 工作 ) 。 因 为 连接 已 经 建立 了 ， 所 以 该 SYN 比特 被 置 为 0。 该 三 次 
握手 的 第 三 个 阶段 可 以 在 报 文 段 负载 中 携带 客户 到 服务 器 的 数据 。 

一 旦 完成 这 3 个 步骤 ， 客 户 和 服务 器 主机 就 可 以 相互 发 送 包 括 数据 的 报 文 段 了 。 在 
以 后 每 一 个 报 文 段 中 ，SYN 比特 都 将 被 置 为 0。 注 意 到 为 了 创建 该 连接 ， 在 两 台 主 机 之 
间 发 送 了 3 个 分 组 ， 如 图 3-39 所 示 。 由 于 这 个 原因 ， 这 种 连接 创建 过 程 通常 被 称 为 3 
次 握手 (three-way handshake), TCP 3 次 握手 的 几 个 方面 将 在 课 后 习题 中 讨论 (为 什么 
需要 初始 序号 ? 为 什么 需要 3 次 握手 ， 而 不 是 两 次 握手 ?) 。 注 意 到 这 样 一 件 事 是 很 有 趣 
的 ， 一 个 攀岩 者 和 一 个 保护 者 (他 位 于 攀岩 者 的 下 面 ， 他 的 任务 是 处 理 好 攀岩 者 的 安全 
绳索 ) 就 使 用 了 与 TCP 相同 的 3 次 握手 通信 协议 ， 以 确保 在 攀岩 者 开始 攀 息 前 双方 都 已 
经 准备 好 了 。 
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图 3-39 TCP 三 次 握手 : 报 文 段 交 换 
天 下 没有 不 散 的 宴席 ， 对 于 TCP 连接 也 是 如 此 。 参 与 一 条 TOP 连接 的 两 个 进程 中 的 


任何 一 个 都 能 终止 该 连接 。 当 连接 结束 后 ， 
主机 中 的 “资源 ” ( 即 缓存 和 变量 ) 将 被 
释放 。 举 一 个 例子 ， 假 设 某 客 户 打算 关闭 
连接 ， 如 图 3-40 所 示 。 客 户 应 用 进程 发 出 
一 个 关闭 连接 命令 。 这 会 引起 客户 TOP 向 
服务 器 进程 发 送 一 个 特殊 的 TCP 报 文 段 。 
这 个 特殊 的 报 文 段 让 其 首部 中 的 一 个 标志 
位 即 FIN 比特 (参见 图 3-29) 被 设置 为 
1。 当 服务 器 接收 到 该 报 文 段 后 ， 就 向 发 送 
方 回 送 一 个 确认 报 文 段 。 然 后 ， 服 务 器 发 
送 它 自 己 的 终止 报 文 段 ， 其 FIN 比特 被 置 
为 1。 最 后 ， 该 客户 对 这 个 服务 器 的 终止 
报 文 段 进行 确认 。 此 时 ， 在 两 台 主 机 上 用 
于 该 连接 的 所 有 资源 都 被 释放 了 。 

在 一 个 TCP 连接 的 生命 周期 内 ， 运 行 
在 每 台 主 机 中 的 TCP 协议 在 各 种 TCP 状 
A (TCP state) 之 间 变 迁 。 图 3-41 说 明了 
客户 TCP 会 经 历 的 一 系列 典型 TCP 状态 。 






客户 服务 器 
关闭 : FIN 
ACK 
FIN :关闭 
ACK 
定时 等 待 
已 关闭 : 
y y 
时 间 时 间 


图 3-40 ”关闭 一 条 TCP 连接 


客户 TCP 开始 时 处 于 CLOSED (关闭 ) 状态 。 客 户 的 应 用 程序 发 起 一 个 新 的 TCP 连接 
(可 通过 在 第 2 草 讲 过 的 Python 例子 中 创建 一 个 Socket 对 象 来 完成 ) 。 这 引起 客户 中 的 TCP 
加 服务 器 中 的 TCP 发 送 一 个 SYN 报 文 段 。 在 发 送 过 SYN 报 文 段 后 ， 客 户 TCP 进入 了 SYN_ 
SENT 状态 。 当 客户 TCP 处 在 SYN_SENT 状态 时 ， 它 等 待 来 自 服务 器 TCP 的 对 客户 所 发 报 
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文 段 进行 确认 且 SYN 比特 被 置 为 1 的 一 个 报 文 段 。 收 到 这 样 一 个 报 文 段 之 后 ， 客 户 TCP 
进入 ESTABLISHED (已 建立 ) 状态 。 当 处 在 ESTABLISHED 状态 时 ，TCP 客户 就 能 发 送 和 
接收 包含 有 效 载荷 数据 ( 即 应 用 层 产生 的 数据 ) 的 TCP 报 文 段 了 。 


客户 应 用 程序 发 起 
一 个 TCP 连 接 
CLOSED 
发 送 SYN 
TIME_WAIT SYN_SENT 
接收 FIN， 接收 SYN & ACK, 
发 送 ACK 发 送 ACK 
FIN_WAIT_2 ESTABLISHED 
发 送 FIN 
接收 ACK， 
”不 发 送 FIN_WAIT_1 
客户 应 用 程序 
发 起 关闭 连接 


图 3-41 客户 TCP 经历 的 典型 的 TCP 状态 序列 


假设 客户 应 用 程序 决定 要 关闭 该 连接 。( 注 意 到 服务 器 也 能 选择 关闭 该 连接 。) 这 引起 
客户 TCP 发 送 一 个 带 有 FIN 比特 被 置 为 1 的 TCP 报 文 段 ， 并 进入 FIN_WAIT_1 状态 。 当 处 
在 FIN_WAIT_1 状态 时 ， 客 户 TCP 等 待 一 个 来 自 服务 器 的 带 有 确认 的 TCP 报 文 段 。 当 它 收 
到 该 报 文 段 时 ， 客 户 TCP 进入 FIN_WAIT_2 状态 。 当 处 在 FIN_WAIT_2 状态 时 ， 客 户 等 待 
来 自 服务 器 的 FIN 比特 被 置 为 1 的 男 一 个 报 文 段 ; 当 收 到 该 报 文 段 后 ， 客 户 TCP 对 服务 器 
的 报 文 段 进行 确认 ， 并 进入 TIME_WAIT 状态 。 假 定 ACK EA, TIME_WAIT 状态 使 TCP 
客户 重 传 最 后 的 确认 报 文 。 在 TIME_WAIT 状态 中 所 消耗 的 时 间 是 与 具体 实现 有 关 的 ， 而 
典型 的 值 是 30 秒 、1 分 钟 或 2 分 钟 。 经 过 等 竺 后， 连接 就 正式 关闭 ， 客 户 端 所 有 资源 ( 包 
括 端口 号 ) 将 被 释放 。 










SYN 洪 泛 攻 击 
我 们 在 TCP 三 次 握手 的 讨论 中 已 经 看 到 ， 服 务 器 为 了 响应 一 个 收 到 的 SYN ， 分 配 并 
初始 化 连接 变量 和 缓存 。 然 后 服务 器 发 送 一 个 SYNACK 进行 响应 ， 并 等 待 来 自 客 户 的 
ACK 报 文 段 。 如 果 某 客户 不 发 送 ACK 来 完成 该 三 次 握手 的 第 三 步 ， 最 终 (通常 在 一 分 
多 钟 之 后 ) 服务 器 将 终止 该 半 开 连接 并 回收 资源 。 | 
这 种 TCP 连接 管理 协议 为 经 典 的 DoS 攻击 即 SYN 洪涝 攻击 (SYN flood attack) 提 | 
供 了 环境 。 在 这 种 攻击 中 ， 攻 击 者 发 送 大量 的 TCP SYN 报 文 段 ， 而 不 完成 第 三 次 握手 | 
的 步骤 。 随 着 这 种 SYN 报 文 段 纷 至 必 来， 服务 器 不 断 为 这 些 半 开 连 接 分 配 资源 (但 从 未 

















| 使 用 ) ， 导 致 服务 器 的 连接 资源 被 消耗 殉 尽 。 这 种 SYN 洪 泛 攻击 是 被 记载 的 众多 DoS 攻 
| 击 中 的 第 一 种 [CERT SYN 1996 ] 。 幸 运 的 是 ， 现 在 有 一 种 有 效 的 防御 系统 ， 称 为 SYN 
cookie [RFC 4987] ， 它 们 被 部 署 在 大 多 数 主流 操作 系统 中 。SYN cookie 以 下 列 方式 
工作 : 

© 当 服 务 器 接收 到 一 个 SYN 报 文 段 时 ， 它 并 不 知道 该 报 文 段 是 来 自 一 个 合法 的 用 
户 ， 还 是 一 个 SYN 洪 泛 攻击 的 一 部 分 。 因 此 服务 器 不 会 为 该 报 文 段 生 成 一 个 半 
开 连 接 。 相 反 ， 服 务 器 生成 一 个 初始 TCP 序列 号 ， 该 序列 号 是 SYN 报 文 段 的 源 
和 目的 卫 地 址 与 端口 号 以 及 仅 有 该 服务 器 知道 的 秘密 数 的 一 个 复杂 函数 (HF! 
函数 ) 。 这 种 精心 制作 的 初始 序列 号 被 称 为 “cookie”。 服 务 器 则 发 送 具 有 这 种 
特殊 初始 序列 号 的 SYNACK 分 组 。 重 要 的 是 ， 服 务 器 并 不 记忆 该 cookie 或 任何 
对 应 于 SYN 的 其 他 状态 信息 。 
e 如 果 客 户 是 合法 的 ， 则 它 将 返回 一 个 ACK 报 文 段 。 当 服务 器 收 到 该 ACK， 需 要 
验证 该 ACK 是 与 前 面 发 送 的 某 些 SYN 相对 应 的 。 如 果 服 务 器 没有 维护 有 关 SYN 
报 文 段 的 记忆 ， 这 是 怎样 完成 的 呢 ? 正如 你 可 能 猜测 的 那样 ， 它 是 借助 于 
cookie 来 做 到 的 。 前 面 讲 过 对 于 一 个 合法 的 ACK， 在 确认 字段 中 的 值 等 于 在 
SYNACK 字段 (此 时 为 cookie 值 ) 中 的 值 加 1 (参见 图 3-39)。 服 务 器 则 将 使 用 
在 SYNACK 报 文 段 中 的 源 和 目的 地 IP 地址 与 端口 号 (它们 与 初始 的 SYN 中 的 
相同 ) 以 及 秘密 数 运行 相同 的 散 列 函数 。 如 果 该 函数 的 结果 加 1 与 在 客户 的 
SYNACK 中 的 确认 (cookie) 值 相 同 的 话 ， 服 务 器 认为 该 ACK 对 应 于 较 早 的 

SYN 报 文 段 ， 因 此 它 是 合法 的 。 服 务 器 则 生成 一 个 具有 套 接 字 的 全 开 的 连接 。 
© 在 另 一 方面 ， 如 果 客 户 没 有 返回 一 个 ACK 报 文 段 ， 则 初始 的 SYN 并 没有 对 服务 











图 3-42 RIR SARA ae) TCP 通常 要 经 历 的 一 系列 状态 ， 其 中 假设 客户 开始 连接 拆 


服务 器 应 用 程序 创建 
KACK, CLOSED 一 个 监听 套 接 字 
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图 3-42 服务 器 端 TCP 经 历 的 典型 的 TCP 状态 序列 
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除 。 这 些 状 态 变迁 是 自 解释 的 。 在 这 两 个 状态 变迁 图 中 ， 我 们 只 给 出 了 TCP 连接 是 如 何 正 
常 地 被 建立 和 拆除 的 。 我 们 没有 描述 在 某 些 不 正常 的 情况 下 (例如 当 连 接 的 双方 同时 都 要 
发 起 或 终止 一 条 连接 时 ) 发 生 的 事情 。 如 果 你 对 此 问题 及 其 他 与 TCP 有 关 的 高 级 问题 感 
兴趣 ， 推 荐 阅读 Stevens 的 内 容 更 全 面 的 书籍 [Stevens 1994 | 。 
我 们 上 面 的 讨论 假定 了 客户 和 服务 器 都 准备 通信 ， 即 服务 器 正在 监听 客户 发 送 其 SYN 
报 文 段 的 端口 。 我 们 来 考虑 当 一 台 主 机 接收 到 一 个 TCP 报 文 段 ， 其 端口 号 或 源 IP 地 址 与 
该 主机 上 进行 中 的 套 接 字 都 不 匹配 的 情况 。 例 如 ， 假 如 一 台 主 机 接收 了 具有 目的 端口 80 
的 一 个 TCP SYN 分 组 ， 但 该 主机 在 端口 80 不 接受 连接 ( 即 它 不 在 端口 80 上 运行 Web Ak 
务 器 ) 。 则 该 主机 将 向 源 发 送 一 个 特殊 重 置 报 文 段 。 该 TCP 报 文 段 将 RST 标志 位 (参见 
3.5.2 节 ) 置 为 1。 因 此 ， 当 主机 发 送 一 个 重 置 报 文 段 时 ， 它 告诉 该 源 “ 我 没有 那个 报 文 
段 的 套 接 字 。 请 不 要 再 发 送 该 报 文 段 了 ”。 当 一 台 主 机 接收 一 个 UDP 分 组 ， 它 的 目的 端口 
与 进行 中 的 UDP 套 接 字 不 匹配 ， 该 主机 发 送 一 个 特殊 的 ICMP 数据 报 ， 这 将 在 第 4 章 中 
讨论 。 
既然 我 们 已 经 对 TCP 连接 管理 有 了 深入 的 了 解 ， 我们 再 次 回顾 nmap 端口 扫描 工具 ， 
并 更 为 详细 地 研究 它 的 工作 原理 。 为 了 探索 目标 主机 上 的 一 个 特定 的 TCP 端口 ， 如 端口 
6789, nmap 将 对 那 台 主机 的 目的 端口 6789 发 送 一 个 特殊 的 TCP SYN 报 文 段 。 有 3 种 可 能 
的 输出 : 
© 源 主机 从 目标 主机 接收 到 一 个 TCP SYNACK 报 文 段 。 因 为 这 意味 着 在 目标 主机 上 
一 个 应 用 程序 使 用 TCP 端口 6789 运行 ，nmap 返回 “打开 ”。 
© 源 主机 从 目标 主机 接收 到 一 个 TCP RST 报 文 段 。 这 意味 着 该 SYN 报 文 段 到 达 了 目 
标 主机 ,但 目标 主机 没有 运行 一 个 使 用 TCP 端口 6789 的 应 用 程序 。 但 攻击 者 至 少 
知道 发 向 该 主机 端口 6789 的 报 文 段 没 有 被 源 和 目标 主机 之 间 的 任何 防火 墙 所 阻 
挡 。( 将 在 第 8 章 中 讨论 防火 墙 。) 
© 源 什么 也 没有 收 到 。 这 很 可 能 表明 该 SYN 报 文 段 被 中 间 的 防火 墙 所 阻挡 ， 无 法 到 
达 目 标 主 机 。 
nmap 是 一 个 功能 强大 的 工具 ， 该 工具 不 仅 能 “侦察 ”打开 的 TCP 端口 ， 也 能 “ 侦 
察 ” 打 开 的 UDP 端口 ， 还 能 “侦察 ”防火 墙 及 其 配置 ， 甚 至 能 “侦察 ”应 用 程序 的 版 本 
和 操作 系统 。 其 中 的 大 多 数 都 能 通过 操作 TCP 连接 管理 报 文 段 完成 [Skoudis 2006 ] 。 读 者 
能 够 从 www. nmap. org 下 载 nmap。 
到 此 ， 我 们 介绍 完了 TCP 中 的 差错 控制 和 流量 控制 。 在 3.7 节 中 ， 我们 将 回 到 TCP 并 
更 深入 地 研究 TCP 拥塞 控制 问题 。 然 而 ， 在 此 之 前 ， 我 们 先后 退 一 步 ， 在 更 广泛 环境 中 讨 
论 拥 塞 控制 问题 。 


3.6 拥塞 控制 原理 


在 前 面 几 节 中 ， 我们 已 经 分 析 了 面临 分 组 丢失 时 用 于 提供 可 靠 数 据 传输 服务 的 基本 原 
理 及 特定 的 TCP 机 制 。 我 们 以 前 讲 过 ， 在 实践 中 ， 这 种 丢 包 一 般 是 当 网 络 变 得 拥塞 时 由 于 
路 由 器 缓存 溢出 引起 的 。 分 组 重 传 因 此 作为 网 络 拥塞 的 征兆 〈 某 个 特定 的 运输 层 报 文 段 的 
ER) 来 对 待 ， 但 是 却 无 法 处 理 导致 网 络 拥塞 的 原因 ， 因 为 有 太 多 的 源 想 以 过 高 的 速率 发 
送 数据 。 为 了 处 理 网 络 拥塞 原因 ， 需 要 一 些 机 制 以 在 面临 网 络 拥塞 时 遏制 发 送 方 。 

在 本 节 中 ， 我 们 考虑 一 般 情 况 下 的 拥塞 控制 问题 ， 试 图 理解 为 什么 网 络 拥塞 是 一 件 坏 


事情 ， 网 络 拥塞 是 如 何在 上 层 应 用 得 到 的 服务 性 能 中 明确 地 显露 出 来 的 ? 如 何 可 用 各 种 方 
法 来 避免 网 络 拥塞 或 对 它 做 出 反应 ? 这 种 对 拥塞 控制 的 更 一 般 研 究 是 恰当 的 ， 因 为 就 像 可 
靠 数 据 传输 一 样 ， 它 在 组 网 技术 中 的 前 10 个 基础 性 重要 问题 清单 中 位 居 前 列 。 下 面 一 节 
详细 研究 TCP 的 拥塞 控制 算法 。 


3.6.1 拥塞 原因 与 代价 


我 们 通过 分 析 3 个 复杂 性 越 来 越 高 的 发 生 拥 塞 的 情况 ， 开 始 对 拥塞 控制 的 一 般 性 研 
究 。 在 每 种 情况 下 ， 我 们 首先 将 看 看 出 现 拥塞 的 原因 以 及 拥塞 的 代价 (根据 资源 未 被 充分 
利用 以 及 端 系统 得 到 的 低劣 服务 性 能 来 评价 ) 。 我 们 暂 不 关注 如 何 对 拥塞 做 出 反应 或 避免 
拥塞 ， 而 是 重点 理解 一 个 较为 简单 的 问题 ， 即 随 着 主机 增加 其 发 送 速率 并 使 网 络 变 得 拥 
塞 ， 这 时 会 发 生 的 情况 。 

1. 情况 1: 两 个 发 送 方 和 一 人 台 具 有 无 穷 大 缓存 的 路 由 絮 

我 们 先 考虑 也 许 是 最 简单 的 拥塞 情况 : 两 台 主 机 (AMB) 都 有 一 条 连接 ， 且 这 两 条 
连接 共享 源 与 目的 地 之 间 的 单 跳 路 由 ， 如 图 3-43 Ara. 
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图 3-43 拥塞 情况 1: 两 条 连接 共享 具有 无 限 大 缓存 的 单 跳 路 由 


我 们 假设 主机 A 中 的 应 用 程序 以 A;, 字 节 / 秒 的 平均 速率 将 数据 发 送 到 连接 中 (例如 ， 
通过 一 个 套 接 字 将 数据 传递 给 运输 层 协议 )。 这 些 数 据 是 初始 数据 ， 这 意味 着 每 个 数据 单 
元 仅 向 套 接 字 中 发 送 一 次 。 下 面 的 运输 层 协议 是 一 个 简单 的 协议 。 数 据 被 封装 并 发 送 ; 不 
执行 差错 恢复 ( 如 重 传 )、 流 量 控制 或 拥塞 控制 。 忽 略 由 于 添加 运输 层 和 较 低层 首部 信息 
产生 的 额外 开销 ， 在 第 一 种 情况 下 ， 主 机 A 向 路 由 需 提 供 流 量 的 速率 是 A;, 字 节 / 秒 。 主 机 
B 也 以 同样 的 方式 运行 ， 为 了 简化 问题 ， 我 们 假设 它 也 是 以 速率 A;, 字 节 / 秒 发 送 数 据 。 来 
自主 机 A 和 主机 B 的 分 组 通过 一 台 路 由 器 ， 在 一 段 容量 为 R 的 共享 式 输出 链 路 上 传输 。 
该 路 由 器 带 有 缓存 ， 可 用 于 当 分 组 到 达 速 率 超过 该 输出 链 路 的 容量 时 存储 “和 分组” 。 在 
此 第 一 种 情况 下 ， 我 们 将 假设 路 由 器 有 无 限 大 的 缓存 空间 。 

图 3-44 描绘 出 了 第 一 种 情况 下 主机 A 的 连接 性 能 。 左 边 的 图 形 描绘 了 每 连接 的 吞吐 
量 (per-connection throughput) (接收 方 每 秒 接收 的 字 节 数 ) 与 该 连接 发 送 速 率 之 间 的 孙 
数 关 系 。 当 发 送 速率 在 0 ~ R/2 之 间 时 ， 接 收 方 的 吞吐 量 等 于 发 送 方 的 发 送 速率 ， 即 发 送 
方 发 送 的 所 有 数据 经 有 限时 延 后 到 达 接 收 方 。 然 而 当 发 送 速率 超过 R/2 时 ， 它 的 吞吐 量 只 
能 达 R/2。 这 个 吞吐 量 上 限 是 由 两 条 连接 之 间 共 享 链 路 容量 造成 的 。 链 路 完全 不 能 以 超过 
R/2 的 稳定 状态 速率 向 接收 方 交付 分 组 。 无 论 主机 A 和 主机 B 将 其 发 送 速 率 设置 为 多 高 ， 
它们 都 不 会 看 到 超过 R/2 的 吞吐 量 。 
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图 3-44 拥塞 情况 1: AE, E EURA ERE RKR 


取得 每 连接 R/2 的 吞吐 量 实际 上 看 起 来 可 能 是 件 好 事 ， 因 为 在 将 分 组 交付 到 目的 地 的 
过 程 中 链 路 被 充分 利用 了 。 但 是 ， 图 3-44b 的 图 形 却 显示 了 以 接近 链 路 容量 的 速率 运行 时 
产生 的 后 果 。 当 发 送 速率 接近 R/2 时 (从 左 至 右 ) ,平均 时 延 就 会 越 来 越 大 。 当 发 送 速 率 
超过 R/2 时 ， 路 由 器 中 的 平均 排队 分 组 数 就 会 无 限 增 长 ， 源 与 目的 地 之 间 的 平均 时 延 也 会 
变 成 无 穷 大 (假设 这 些 连接 以 此 发 送 速率 运行 无 限 长 时 间 并 且 有 无 限量 的 缓存 可 用 ) 。 因 
此 ， 虽 然 从 吞吐 量 角 度 看 ， 运 行 在 总 吞吐 量 接近 R 的 状态 也 许 是 一 个 理想 状态 ,但 从 时 延 
角度 看 ， 却 远 不 是 一 个 理想 状态 。 甚 至 在 这 种 (极端) 理想 化 的 情况 中 ， 我 们 已 经 发 现 了 
拥塞 网 络 的 一 种 代价 ， 即 当 分 组 的 到 达 速 率 接 近 链 路 容量 时 ， 分 组 经 历 巨大 的 排队 时 延 。 

2. 情况 2: 两 个 发 送 方 和 一 台 具 有 有 限 缓存 的 路 由 红 

现在 我 们 从 下 列 两 个 方面 对 情况 1 稍微 做 一 些 修 改 〈 参 见 图 3-45) 。 首 先 ， 假 定 路 由 
器 缓存 的 容量 是 有 限 的 。 这 种 现实 世界 的 假设 的 结果 是 ， 当 分 组 到 达 一 个 已 满 的 缓存 时 会 
被 丢弃 。 其 次 ， 我 们 假定 每 条 连接 都 是 可 靠 的 。 如 果 一 个 包含 有 运输 层 报 文 段 的 分 组 在 路 
由 器 中 被 丢弃 ， 那 么 它 终 将 被 发 送 方 重 传 。 由 于 分 组 可 以 被 重 传 ， 所 以 我 们 现在 必须 更 小 
心地 使 用 发 送 速率 这 个 术语 。 特 别 是 我 们 再 次 以 入 ,, 字 节 / 秒 表示 应 用 程序 将 初始 数据 发 送 
到 套 接 字 中 的 速率 。 运 输 层 向 网 络 中 发 送 报 文 段 (含有 初始 数据 或 重 传 数据 ) 的 速率 用 
作 字 节 / 秒 表示 。A 有 时 被 称 为 网 络 的 供给 载荷 (offered load) 。 
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图 3-45 ”情况 2: (有 重 传 的 ) 两 台 主机 与 一 台 拥 有 有 限 缓存 的 路 由 器 
在 情况 2 下 实现 的 性 能 强烈 地 依赖 于 重 传 的 方式 。 首 先 ， 考 虑 一 种 不 真实 的 情况 ， 即 


主机 A 能 够 以 某 种 方式 〈 不 可 思议 地 !) 确定 路 由 器 中 的 缓存 是 否 空 凋 ， 因 而 仅 当 缓存 空 
亲 时 才 发 送 一 个 分 组 。 在 这 种 情况 下 ， 将 不 会 产生 丢 包 ，Ai 与 Ap 相等 ， 并 且 连 接 的 吞吐 
量 就 等 于 As。 图 3-46a 中 描述 了 这 种 情况 。 从 否 吐 量 的 角度 看 ， 性 能 是 理想 的 ， 即 发 送 的 
每 个 分 组 都 被 接收 到 。 注 意 到 在 这 种 情况 下 ， 平均 主 机 发 送 速率 不 能 超过 RA2， 因 为 假定 
不 会 发 生 分 组 丢失 。 

接 下 来 考虑 一 种 更 为 真实 的 情况 ， 发 送 方 仅 当 在 确定 了 一 个 分 组 已 经 丢失 时 才 重 传 。 
(同样 ， 所 做 的 假设 有 一 些 弹性 。 然 而 ， 发 送 主机 有 可 能 将 超时 时 间 设 置 得 足够 长 ， 以 无 
形 中 使 其 确信 一 个 还 没有 被 确认 的 分 组 已 经 丢失 。) 在 这 种 情况 下 ， 性 能 就 可 能 与 图 3-46b 
所 示 的 情况 相似 。 为 了 理解 这 时 发 生 的 情况 ， 考 虑 一 下 供给 载荷 As (初始 数据 传输 加 上 
重 传 的 总 速率 ) 等 于 R/2 的 情况 。 根 据 图 3-46b， 在 这 一 供给 载荷 值 时 ， 数 据 被 交付 给 接 
收 方 应 用 程序 的 速率 是 RA3。 因 此 ， 在 所 发 送 的 0. 5R 单位 数据 当中 ， 从 平均 的 角度 说 ， 
0. 333R 字 节 / 秒 是 初始 数据 ， 而 0. 166R 字 节 / 秒 是 重 传 数据 。 我 们 在 此 看 到 了 另 一 种 网 络 
拥塞 的 代价 ， 即 发 送 方 必 须 执行 重 传 以 补偿 因为 缓存 溢出 而 丢弃 (丢失 ) 的 分 组 。 

最 后 ， 我 们 考虑 下 面 一 种 情况 : 发 送 方 也 许 会 提前 发 生 超时 并 重 传 在 队列 中 已 被 推迟 
但 还 未 丢失 的 分 组 。 在 这 种 情况 下 ， 初 始 数据 分 组 和 重 传 分 组 都 可 能 到 达 接 收 方 。 当 然 ， 
接收 方 只 需要 一 份 这 样 的 分 组 副本 就 行 了 ， 重 传 分 组 将 被 丢 奔 。 在 这 种 情况 下 ， 路 由 天 转 
发 重 传 的 初始 分 组 副本 是 在 做 无 用 功 ， 因 为 接收 方 已 收 到 了 该 分 组 的 初始 版 本 。 而 路 由 器 
本 可 以 利用 链 路 的 传输 能 力 去 发 送 为 一 个 分 组 。 这 里 ,我们 又 看 到 了 网 络 拥塞 的 另 一 种 代 
价 ， 即 发 送 方 在 遇 到 大 时 延 时 所 进行 的 不 必要 重 传 会 引起 路 由 器 利用 其 链 路 带宽 来 转发 不 
必要 的 分 组 副本 。 图 3-46c 显示 了 当 假 定 每 个 分 组 被 路 由 器 转发 (平均 ) 两 次 时 ， 否 吐 量 
与 供给 载荷 的 对 比 情况 。 由 于 每 个 分 组 被 转发 两 次 ， 当 其 供给 载荷 接近 R/2 时 ， 其 吞吐 量 
将 渐 近 R/4。 


m 


b) 
图 3-46 具有 有 限 缓存 时 情况 2 的 性 能 





3. 情况 3: 4 个 发 送 方 和 具有 有 限 缓存 的 多 台 路 由 如 及 多 跳 路 径 

在 最 后 一 种 拥塞 情况 中 ， 有 4 台 主 机 发 送 分 组 ， 每 台 都 通过 交 夺 的 两 跳 路 径 传 输 ， 如 
图 3-47 所 示 。 我 们 再 次 假设 每 台 主 机 都 采用 超时 / 重 传 机 制 来 实现 可 靠 数据 传输 服务 ， 所 
有 的 主机 都 有 相同 的 Ai 值 ， 所 有 路 由 需 的 链 路 容量 都 是 尺 字 节 / 秒 。 

我 们 考虑 从 主机 A 到 主机 C 的 连接 ， 该 连接 经 过 路 由 器 RI1 和 R2。A -C 连接 与 D - 
B 连接 共享 路 由 器 R1， 并 与 B - D 连接 共享 路 由 器 R2。 对 极 小 的 As 值 ， 路 由 器 缓存 的 滋 
出 是 很 少见 的 (与 拥塞 情况 1、 拥 塞 情 况 2 中 的 一 样 ) ， 吞 吐 量 大 致 接近 供给 载荷 。 对 稍 
大 的 Ai 值 ， 对 应 的 吞吐 量 也 更 大 ， 因 为 有 更 多 的 初始 数据 被 发 送 到 网 络 中 并 交付 到 目的 
地 ， 滋 出 仍然 很 少 。 因 此 ， 对 于 较 小 的 A;,，A;, 的 增 大 会 导致 和 A。 的 增 大 。 
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4n: 初始 数据 


in? 初始 数据 加 重 传 数据 — how 





图 3-47 ”四 个 发 送 方 和 具有 有 限 缓存 的 多 台 路 由 器 及 多 跳 路 径 


在 考虑 了 流量 很 小 的 情况 后 ， 下 面 分 析 当 A;。( 因此 An) 很 大 时 的 情况 。 考 虑 路 由 器 
R2。 不 管 ;的 值 是 多 大 ， 到 达 路 由 右 R2 的 A -C 流量 (在 经 过 路 由 冀 RI 转发 后 到 达 路 
由 器 R2) 的 到 达 速 率 至 多 是 R， 也 就 是 从 RI 到 R 的 链 路 容量 。 如 果 Ai 对 于 所 有 连接 
(包括 B-D 连接 ) 来 说 是 极 大 的 值 ， 那 么 在 RR2 上 ，B -DD 流量 的 到 达 速 率 可 能 会 比 A-C 
流量 的 到 达 速 率 大 得 多 。 因 为 A -C 流量 与 B -D 流量 在 路 由 器 R2 上 必须 为 有 限 缓存 空间 


而 竞争 ， 所 以 当 来 自 B -DD 连接 的 供给 载 答 越 来 
越 大 时 ，A -C 连接 上 成 功 通过 R2 ( 即 由 于 缓存 
溢出 而 未 被 丢失 ) 的 流量 会 越 来 越 小 。 在 极限 情 
况 下 ， 当 供给 载荷 趋 近 于 无 穷 大 时 ，R2 的 空闲 
缓存 会 立即 被 B -D 连接 的 分 组 占 满 ， 因 而 A -C 
连接 在 R2 上 的 吞吐 量 趋 近 于 0。 这 又 一 次 说 明 
在 重 载 的 极限 情况 下 ，A - C 端 到 端 吞吐 量 将 趋 
近 于 0。 这 些 考虑 引发 了 供给 载 符 与 吞吐 量 之 间 
的 权衡 ， 如 图 3-48 所 示 。 

当 考 虑 由 网 络 所 做 的 浪费 掉 的 工作 量 时 ， 
随 着 供给 载荷 的 增加 而 使 吞吐 量 最 终 减 少 的 原 
因 是 明显 的 。 在 上 面 提 到 的 大 流量 的 情况 中 ， 


R/2 


At 


图 3-48 具有 有 限 缓存 和 多 跳 
路 径 时 的 情况 3 性 能 


每 当 有 一 个 分 组 在 第 二 跳 路 由 器 上 被 丢弃 时 ， 第 一 跳 路 由 器 所 做 的 将 分 组 转发 到 第 二 
跳 路 由 器 的 工作 就 是 “ 劳 而 无 功 ” 的 。 如 果 第 一 跳 路 由 器 只 是 丢弃 该 分 组 并 保持 空 
闲 ， 则 网 络 中 的 情况 是 幸运 的 〈 更 准确 地 说 是 糟糕 的 ) 。 需 要 指出 的 是 ， 第 一 跳 路 由 
器 所 使 用 的 将 分 组 转发 到 第 二 跳 路 由 器 的 传输 容量 用 来 传送 不 同 的 分 组 可 能 更 有 效 


益 。( 例 如 ， 当 选择 一 个 分 组 发 送 时 ， 路 由 上 需 最 好 优先 考虑 那些 已 经 历 过 一 定数 量 的 
上 游 路 由 器 的 分 组 。) 所 以 ， 我 们 在 此 又 看 到 了 由 于 拥塞 而 丢弃 分 组 的 另 一 种 代价 ， 
即 当 一 个 分 组 沿 一 条 路 径 被 丢弃 时 ， 每 个 上 游 路 由 器 用 于 转发 该 分 组 到 丢弃 该 分 组 而 
使 用 的 传输 容量 最 终 被 浪费 掉 了 。 


3.6.2 拥塞 控制 方法 


在 3.7 节 中 ， 我 们 将 详细 研究 TCP 用 于 拥塞 控制 的 特定 方法 。 这 里 ， 我 们 指出 在 实践 
中 所 采用 的 两 种 主要 拥塞 控制 方法 ， 讨论 特 定 的 网 络 体系 结构 和 具体 使 用 这 些 方 法 的 拥塞 
控制 协议 。 
在 最 为 宽泛 的 级 别 上 ， 我 们 可 根据 网 络 层 是 否 为 运输 层 拥塞 控制 提供 了 显 式 帮 助 ,来 
区 分 拥塞 控制 方法 。 
© 端 到 端 拥塞 控制 。 在 端 到 端 拥塞 控制 方法 中 ， 网 络 层 没有 为 运输 层 拥 塞 控制 提供 
显 式 支持 。 即 使 网 络 中 存在 拥塞， 端 系 统 也 必须 通过 对 网 络 行为 的 观察 (如 分 组 
丢失 与 时 延 ) 来 推断 之 。 我 们 将 在 3.7.1 市 中 将 看 到 ，TCP 采用 疹 到 端的 方法 解 
决 拥塞 控制 ， 因 为 IP 层 不 会 癌 端 系统 提供 有 关 网 络 拥塞 的 反馈 信息 。TCP 报 文 段 
的 丢失 (通过 超时 或 3 次 元 余 确 认 而 得 知 ) 被 认为 是 网 络 拥塞 的 一 个 迹象 ，TCP 
会 相应 地 减 小 其 窗口 长 度 。 我 们 还 将 看 到 关于 TCP 拥塞 控制 的 一 些 最 新 建议 ， 即 
使 用 增加 的 往返 时 延 值 作为 网 络 拥塞 程度 增加 的 指示 。 
© 网 络 辅助 的 拥塞 控制 。 在 网 络 辅助 的 拥塞 控制 中 ， 路 由 需 回 发 送 方 提供 关于 网 络 
中 拥塞 状态 的 显 式 反馈 信息 。 这 种 反馈 可 以 简单 地 用 一 个 比特 来 指示 链 路 中 的 拥 
塞 情况 。 该 方法 在 早期 的 IBM SNA | Schwartz 1982 |, DEC DECnet [Jain 1989; 
Ramakrishnan 1990 | 和 ATM | Black 1995] 等 体系 结构 中 被 采用 。 更 复杂 的 网 络 
反馈 也 是 可 能 的 。 例 如 ,在 ATM 可 用 比特 率 (Available Bite Rate, ABR) 拥塞 控 
制 中 ， 路 由 需 显 式 地 通知 发 送 方 它 〈 路 由 天 ) 能 在 输出 链 路 上 文 持 的 最 大 主机 发 
送 速率 。 如 上 面 所 提 到 的 ， 默 认 因 特 网 版 本 的 IP 和 TCP 采用 端 到 端 拥 塞 控 制 方 
法 。 然 而 ， 我 们 在 3. 7. 2 节 中 将 看 到 ， 最 近 IP A TCP 也 能 够 选择 性 地 实现 网 络 辅 


助 拥塞 控制 。 
对 于 网 络 辅助 的 拥塞 控制 ， 拥 塞 信息 从 网 络 反馈 到 发 送 方 通常 有 两 种 方式 ， 如 图 3-49 
主机 A 





经 由 接收 方 的 网 络 反馈 


CT 









“、、 直 接 网 络 反馈 


图 3-49 网 络 指示 拥塞 信息 的 两 种 反馈 路 径 
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所 示 。 直 接 反馈 信息 可 以 由 网 络 路 由 器 发 给 发 送 方 。 这 种 方式 的 通知 通常 采用 了 一 种 阻塞 
分 组 (choke packet) 的 形式 〈 主 要 是 说 :“ 我 拥塞 了 ! ”) 。 更 为 通用 的 第 二 种 形式 的 通知 
是 ， 路 由 天 标记 或 更 新 从 发 送 方 流 回 接收 方 的 分 组 中 的 某 个 字段 来 指示 拥塞 的 产生 。 一 旦 
收 到 一 个 标记 的 分 组 后 ， 接 收 方 就 会 癌 发 送 方 通知 该 网 络 拥塞 指示 。 注 意 到 后 一 种 形式 的 
通知 至 少 要 经 过 一 个 完整 的 往返 时 间 。 


3.7 TCP 拥塞 控制 


在 本 节 中 ， 我 们 再 次 来 学 习 TCP。 如 我 们 在 3. 5 节 所 见 ，TCP 为 运行 在 不 同 主机 上 的 
两 个 进程 之 间 提 供 了 可 靠 传输 服务 。TCP 的 另 一 个 关键 部 分 就 是 其 拥塞 控制 机 制 。 如 在 前 
一 节 所 指出 ，TCP 必须 使 用 问 到 端 拥塞 控制 而 不 是 使 网 络 辅助 的 拥塞 控制 ， 因 为 IP 层 不 
向 端 系统 提供 显 式 的 网 络 拥塞 反馈 。 

TCP 所 采用 的 方法 是 让 每 一 个 发 送 方 根据 所 感知 到 的 网 络 拥塞 程度 来 限制 其 能 向 
连接 发 送 流量 的 速率 。 如 果 一 个 TCP 发 送 方 感知 从 它 到 目的 地 之 间 的 路 径 上 没什么 拥 
Æ, M TCP 发 送 方 增加 其 发 送 速率 ; 如 果 发 送 方 感知 沿 着 该 路 径 有 拥 蹇 ， 则 发 送 方 就 
会 降低 其 发 送 速率 。 但 是 这 种 方法 提出 了 三 个 问题 。 第 一 ， 一 个 TCP 发 送 方 如 何 限制 
它 向 其 连接 发 送 流量 的 速率 呢 ? 第 二 ， 一 个 TCP 发 送 方 如 何 感知 从 它 到 目的 地 之 间 的 
路 径 上 存在 拥塞 呢 ? 第 三 ， 当 发 送 方 感知 到 端 到 端的 拥塞 时 ， 采 用 何 种 算法 来 改变 其 
发 送 速率 呢 ? 

我 们 首先 分 析 一 下 TCP 发 送 方 是 如 何 限制 向 其 连接 发 送 流量 的 。 在 3.5 节 中 我 们 看 
到 ，TCP 连接 的 每 一 端 都 是 由 一 个 接收 缓存 、 一 个 发 送 缓存 和 几 个 变量 (LastByteRead 、 
rwnd 等 ) 组 成 。 运 行 在 发 送 方 的 TCP 拥塞 控制 机 制 跟 踪 一 个 额外 的 变量 ， 即 拥塞 窗口 
(congestion window) 。 拥 塞 窗口 表示 为 cwnd， 它 对 一 个 TCP 发 送 方 能 向 网 络 中 发 送 流量 的 
速率 进行 了 限制 。 特 别 是 ， 在 一 个 发 送 方 中 未 被 确认 的 数据 量 不 会 超过 cwnd 与 rwnd 中 的 
最 小 值 ， 即 

LastByteSent - LastByteAcked<min | cwnd，rwnd | 

为 了 关注 拥塞 控制 (与 流量 控制 形成 对 比 )， 我 们 后 面 假设 TCP 接收 缓存 足够 大 ， 以 
至 可 以 忽略 接收 窗口 的 限制 ; 因此 在 发 送 方 中 未 被 确认 的 数据 量 仅 受 限于 cwnd。 我 们 还 
假设 发 送 方 总 是 有 数据 要 发 送 ， 即 在 拥塞 窗口 中 的 所 有 报 文 段 要 被 发 送 。 

上 面 的 约束 限制 了 发 送 方 中 未 被 确认 的 数据 量 ， 因 此 间接 地 限制 了 发 送 方 的 发 送 速 
率 。 为 了 理解 这 一 点 ， 我 们 来 考虑 一 个 丢 包 和 发 送 时 延 均 可 以 忽略 不 计 的 连接 。 因 此 粗略 
地 讲 ， 在 每 个 往返 时 间 (RTT) 的 起 始点 ， 上 面 的 限制 条 件 允许 发 送 方向 该 连接 发 送 cwnd 
个 字 节 的 数据 ， 在 该 RTT 结束 时 发 送 方 接收 对 数据 的 确认 报 文 。 因 此 ， 该 发 送 方 的 发 送 速 
率 大 概 是 cwnd/RIT 字 节 / 秒 。 通 过 调节 cwnd 的 值 ， 发 送 方 因此 能 调整 它 向 连接 发 送 数 据 
的 速率 。 

我 们 接 下 来 考虑 TCP 发 送 方 是 如 何 感知 在 它 与 目的 地 之 间 的 路 径 上 出 现 了 拥塞 的 。 我 
们 将 一 个 TCP AKT HW “ESE” ELA: 要 么 出 现 超时 ， 要么 收 到 来 自 接收 方 的 3 
个 元 余 ACK。( 回想 我 们 在 3. 5.4 节 有 关 图 3-33 中 的 超时 事件 的 讨论 和 收 到 3 个 元 余 ACK 
后 包括 快速 重 传 的 后 继 修 改 。) 当 出 现 过 度 的 拥塞 时 ， 在 沿 着 这 条 路 径 上 的 一 台 (或 多 
a) 路 由 器 的 缓存 会 溢出 ， 引 起 一 个 数据 报 (包含 一 个 TCP 报 文 段 ) HER EFA 


据 报 接着 会 引起 发 送 方 的 丢 包 事件 〈 要 么 超时 或 收 到 3 个 元 余 ACK) ， 发 送 方 就 认为 在 发 
送 方 到 接收 方 的 路 径 上 出 现 了 拥塞 的 指示 。 
考虑 了 拥塞 检测 问题 后 ， 我 们 接 下 来 考虑 网 络 没有 拥塞 这 种 更 为 乐观 的 情况 ， 即 没有 
出 现 丢 包 事 件 的 情况 。 在 此 情况 下 , 在 TCP 的 发 送 方 将 收 到 对 于 以 前 未 确认 报 文 段 的 确 
认 。 如 我 们 将 看 到 的 那样 ，TCP 将 这 些 确 认 的 到 达 作 为 一 切 正常 的 指示 ， 即 在 网 络 上 传输 
的 报 文 段 正 被 成 功 地 交付 给 目的 地 ， 并 使 用 确认 来 增加 窗口 的 长 度 (及 其 传输 速率 )。 注 
意 到 如 果 确 认 以 相当 慢 的 速率 到 达 (例如 ， 如 果 该 端 到 端 路 径 具 有 高 时 延 或 包含 一 段 低 带 
宽 链 路 ) ， 则 该 拥塞 窗口 将 以 相当 慢 的 速率 增加 。 在 另 一 方面 ， 如 果 确 认 以 高 速率 到 达 ， 
则 该 拥塞 窗口 将 会 更 为 迅速 地 增 大 。 因 为 TCP 使 用 确认 来 触发 (或 计时 ) 增 大 它 的 拥塞 
窗口 长 度 ，TCP 被 说 成 是 自 计 时 (self-clocking) 的 。 
给 定 调 节 cwnd 值 以 控制 发 送 速率 的 机 制 ， 关 键 的 问题 依然 存在 : TCP 发 送 方 怎样 确 
定 它 应 当 发 送 的 速率 呢 ? 如 果 众 多 TCP 发 送 方 总 体 上 发 送 太 快 ， 它 们 能 够 拥塞 网 络 ， 导 致 
我 们 在 图 3-48 中 看 到 的 拥塞 月 溃 。 事 实 上， 为 了 应 对 在 较 早 TCP 版 本 下 观察 到 的 因特网 
HAE HAY | Jacobson 1988 ] ， 研 发 了 该 版 本 的 TCP (我 们 马上 将 学 习 它 ) 。 然 而 ， 如 果 TCP 
发 送 方 过 于 谨慎 ， 发 送 太 慢 ， 它 们 不 能 充分 利用 网 络 的 带宽 ; 这 就 是 说 ，TCP 发 送 方 能 够 
以 更 高 的 速率 发 送 而 不 会 使 网 络 拥 塞 。 那 么 TCP 发 送 方 如 何 确 定 它们 的 发 送 速率 ， 既 使 得 
网 络 不 会 拥塞 ， 与 此 同时 又 能 充分 利用 所 有 可 用 的 带宽 ? TCP 发 送 方 是 显 式 地 协作 ， 或 存 
在 一 种 分 布 式 方法 使 TCP 发 送 方 能 够 仅 基于 本 地 信息 设置 它们 的 发 送 速率 ? TCP 使 用 下 列 
指导 性 原则 回答 这 些 问 题 : 
© 一 个 丢失 的 报 文 段 表 意味 着 拥塞 ， 因 此 当 丢 失 报 文 段 时 应 当 降 低 TCP 发 送 方 的 
速率 。 回 想 在 3.5.4 节 中 的 讨论 ， 对 于 给 定 报 文 段 ， 一 个 超时 事件 或 四 个 确认 
(一 个 初始 ACK 和 其 后 的 三 个 见 余 ACK) 被 解释 为 跟随 该 四 个 ACK 的 报 文 段 的 
“ 丢 包 事件 ”的 一 种 隐 含 的 指示 。 从 拥塞 控制 的 观点 看 ， 该 问题 是 TCP 发 送 方 
应 当 如 何 减 小 它 的 拥塞 窗口 长 度 ， 即 减 小 其 发 送 速率 ， 以 应 对 这 种 推测 的 丢 包 
事件 。 
© 一 个 确认 报 文 段 指示 该 网 络 正 在 向 接收 方 交付 发 送 方 的 报 文 段 ， 因 此 ， 当 对 先前 
未 确认 报 文 段 的 确认 到 达 时 ， 能 够 增加 发 送 方 的 速率 。 确 认 的 到 达 被 认为 是 一 切 
顺利 的 隐 含 指示 ， 即 报 文 段 正 从 发 送 方 成 功 地 交付 给 接收 方 ， 因 此 该 网 络 不 拥塞 。 
拥塞 窗口 长 度 因 此 能 够 增加 。 
e 带宽 探测 。 给 定 ACK 指示 源 到 目的 地 路 径 无 拥塞 ， 而 丢 包 事件 指示 路 径 拥 
Æ, TCP 调节 其 传输 速率 的 策略 是 增加 其 速率 以 啊 应 到 达 的 ACK， 除 非 出 现 
丢 包 事件 ， 此 时 才 减 小 传输 速率 。 因 此 ， 为 探测 拥塞 开始 出 现 的 速率 ，TCP 
发 送 方 增加 它 的 传输 速率 ， 从 该 速率 后 退 ， 进 而 再 次 开始 探测 ， 看 看 拥塞 开 
始 速 率 是 否 发 生 了 变化 。TCP 发 送 方 的 行为 也 许 类 似 于 要 求 (并 得 到 ) RK 
越 多 糖果 的 孩子 ， 直 到 最 后 告知 他 /她 “不 行 !”， 孩 子 后 退 一 点 ， 然 后 过 一 会 
儿 再 次 开始 提出 请 求 。 注 意 到 网 络 中 没有 明确 的 拥塞 状态 信 令 ， 即 ACK ME 
包 事 件 充当 了 隐 式 信号 ， 并 且 每 个 TCP 发 送 方 根据 异步 于 其 他 TCP 发 送 方 的 
本 地 信息 而 行动 。 
概述 了 TCP 拥塞 控制 后 ， 现 在 是 我 们 考虑 广 受 赞 誉 的 TCP 拥塞 控制 算法 (TCP 
congestion control algorithm) 细节 的 时 候 了 ， 该 算法 首先 在 [Jacobson 1988] 中 描述 并 


178 R 3Ë 


HA [RFC 5681] 中 标准 化 。 该 算法 包括 3 个 主要 部 分 : 由 慢 启动 ; 包 拥 塞 避 免 ; 
二 快速 恢复 。 慢 启动 和 拥塞 避免 是 TCP 的 强制 部 分 ， 两 者 的 差异 在 于 对 收 到 的 ACK 
做 出 反应 时 增加 cwnd 长 度 的 方式 。 我 们 很 快 将 会 看 到 慢 启 动 比 拥塞 避免 能 更 快 地 增 
加 cwnd 的 长 度 ( 不 要 被 名 称 所 迷惑 1) 。 快 速 恢复 是 推荐 部 分 ， 对 TCP 发 送 方 并 非 是 
必需 的 。 

1. 慢 局 动 


当 一 条 TCP 连接 开始 时 ，cwnd 的 值 通 常 初 始 置 为 一 个 MSS 的 较 小 值 [RFC 3390], 
这 就 使 得 初始 发 送 速率 大 约 为 MSSARTT。 例 如 ， 如 果 MSS =500 i H. RTT =200ms， 则 
得 到 的 初始 发 送 速率 大 约 只 有 20kbps。 由 于 对 TCP 发 送 方 而 言 ， 可 用 带宽 可 能 比 MSS/ 
RTT 大 得 多 ，TCP 发 送 方 而 望 迅 速 找到 可 用 
带宽 的 数量 。 因 此 ， 在 慢 启 动 〈slow- start ) 
状态 ，cwnd 的 值 以 1 个 MSS 开始 并 且 每 当 
传输 的 报 文 段 首次 被 确认 就 增加 1 个 MSS, 


在 图 3-50 所 示 的 例子 中 ，TCP 向 网 络 发 送 : Mite : 
第 一 个 报 文 段 并 等 待 一 个 确认 。 当 该 确认 到 i 
达 时 ，TCP Rak He NE BE mA. T: : 
两 个 报 文 段 被 确认 ， 则 发 送 方 对 每 个 确认 报 2 个 报 文 让 : 
文 段 将 拥塞 窗口 增加 一 个 MSS， 使 得 拥塞 窗 


口 变 为 4 个 MSS， 并 这 样 下 去 。 这 一 过 程 每 
过 一 个 RIT， 发 送 速率 就 翻 看 。 因 此，TCP 
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发 送 速率 起 始 慢 ， 但 在 慢 启 动 阶段 以 指数 。 : Lh xm 
增长 。 

但 是 ， 何 时 结束 这 种 指数 增长 呢 ? 慢 SS: 
局 动 对 这 个 问题 提供 了 几 种 答案 。 BGs : —<—— 
如 果 存 在 一 个 由 超时 指示 的 丢 包 事件 ( 即 : : 

hÁ 


HAZE) TCP 发 送 方 将 cwnd 设置 为 1 并 重 
新 开始 慢 启 动 过 程 。 它 还 将 第 二 个 状态 变 i 
量 的 值 ssthresh 〈(“ 慢 局 动 国 值 ”的 速记 ) ee 

设置 为 cwnd/2, ， 即 当 检测 到 拥塞 时 将 ssthresh 置 为 拥塞 窗口 值 的 一 半 。 慢 启动 结 束 的 
第 二 种 方式 是 直接 与 ssthresh 的 值 相关 联 。 因 为 当 检 测 到 拥塞 时 ssthresh 设 为 cwnd 的 值 
一 半 ， 当 到 达 或 超过 ssthresh 的 值 时 ， 继 续 使 cwnd 翻番 可 能 有 些 鲁 葵 。 因 此 ， 当 cwnd 
的 值 等 于 ssthresh 时 ， 结 束 慢 启动 并 且 TCP 转移 到 拥塞 避免 模式 。 我 们 将 会 看 到 ， 当 
进入 拥塞 避免 模式 时 ，TCP 更 为 谨慎 地 增加 cwnd。 最 后 一 种 结束 慢 启 动 的 方式 是 ， 
如 果 检 测 到 3 ATR ACK, XH TCP 执行 一 种 快速 重 传 (参见 3.5.4 7) 并 进入 快 
速 恢复 状态 ， 后 面 将 讨论 相关 内 容 。 慢 启动 中 的 TCP 行为 总 结 在 图 3-51 中 的 TCP 拥 
塞 控制 的 FSM 描述 中 。 慢 启动 算法 最 早 源 于 [Jacobson 1988]; 在 [Jain 1986] 中 独 
立地 提出 了 一 种 类 似 于 慢 启 动 的 方法 。 


v 
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cwnd=1 cwnd=ssthresh 
dupACKcount=0 dupACKcount=0 
retransmit missing segment 





dupACKcount==3 dupACKcount==3 


ssthresh=cwnd/2 
cwnd=ssthresh+3-MSS 
retransmit missing segment 
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快速 恢复 


duplicate ACK t) 


cwnd=cwnd+MSS 
transmit new segment(s), as allowed 


图 3-51 TCP 拥塞 控制 的 FSM 描述 


TCP RR: 优化 云 服务 的 性 能 


对 于 诸如 搜索 、 电 子 邮 件 和 社交 网 络 等 云 服务 ， 非 常 希望 提供 高 水 平 的 响应 性 ， 给 
用 户 一 种 完美 的 印象 ， 即 这 些 服务 正 运行 在 它们 自己 的 端 系统 (包括 其 智能 手机 ) 中 。 
因为 用 户 经 常 位 于 远离 数据 中 心 的 地 方 ， 而 这 些 数据 中 心 负责 为 云 服务 关联 的 动态 内 容 
提供 服务 。 实 际 上 ， 如 果 端 系统 远离 数据 中 心 ， 则 RTT 将 会 很 大 ， 会 由 于 TCP RZ 
潜在 地 导致 低劣 的 响应 时 间 性 能 。 

作为 一 个 学 习 案 例 ， 考 虑 接收 对 某 搜 索 问题 的 响应 中 的 时 延 。 通 常 ， 服 务 器 在 慢 启 
| 动 期 间 交 付 响应 要 求 三 个 TCP 窗口 [Pathak 2010] 。 所 以 从 某 端 系统 发 起 一 条 TCP 连接 
到 它 收 到 该 响应 的 最 后 一 个 分 组 的 时 间 粗 略 是 4*RTT ( 用 于 建立 TCP 连接 的 一 个 RTT 
加 上 用 于 3 个 数据 窗口 的 3 个 RIT)， 再 加 上 在 数据 中 心中 处 理 的 时 间 。 对 于 一 个 相当 
小 的 查询 来 说 ， 这 些 RTT 时 延 导 致 其 返回 搜索 结果 中 显而易见 的 时 延 。 此 外 ， 在 接 入 网 
中 可 能 有 较 大 的 丢 包 ， 导 致 TCP 重 传 甚至 较 大 的 时 延 。 
| 缓解 这 个 问题 和 改善 用 户 感 受到 的 性 能 的 一 个 途径 是 : 四部 署 邻 近 用 户 的 前 端 服务 
Z, @ 在 该 前 端 服务 器 利用 TCP 分 贫 (TCP splitting) 来 分 裂 TCP 连接 。 借 助 于 TCP 分 
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岔 ， 客 户 向 邻近 前 端 连接 一 条 TCP 连接 ， 并 且 该 前 端 以 非常 大 的 窗口 向 数据 中 心 维 护 一 
条 TCP 连接 [Tariq 2008, Pathak 2010, Chen 2011]。 使 用 这 种 方法 ， 响 应 时 间 大 致 变 
为 4* RTT + RTT + 处理 时 间 ， 其 中 RTTi. 是 客户 与 前 端 服务 器 之 间 的 往返 时 间 ， 
RTTse 是 前 端 服 务 器 与 数据 中 心 (后 端 服务 器 ) 之 间 的 往返 时 间 。 如 果 前 端 服务 器 邻近 
客户 ， 则 该 响应 时 间 大 约 变 为 RTTse 加 上 处 理 时 间 ， 因 为 RTTps 小 得 微不足道 并 且 RTT p 
约 为 RTT。 总 而 言 之 ，TCP 分 岔 大 约 能 够 将 网 络 时 延 从 4* RIT 减少 到 RIT, AKA 
善 用 户 感受 的 性 能 ， 对 于 远离 最 近 数 据 中 心 的 用 户 更 是 如 此 。TCP 分 岔 也 有 助 于 减少 因 
接 入 网 丢 包 引起 的 TCP 重 传 时 延 。 SK, Google 和 Akamai 在 接 入 网 中 广泛 利用 了 它们 
的 CDN 服务 器 (回想 2.6 节 中 的 讨论 )， 为 它们 支持 的 云 服 务 来 执行 TCP FF [Chen 
2011]. 









2. 拥塞 避免 

一 旦 进入 拥塞 避免 状态 ，cwnd 的 值 大 约 是 上 次 遇 到 拥塞 时 的 值 的 一 半 ， 即 距离 拥塞 
可 能 并 不 遥远 ! 因此 ，TCP 无 法 每 过 一 个 RTT 再 将 cwnd 的 值 翻番 ， 而 是 采用 了 一 种 较为 
保守 的 方法 ， 每 个 RTT 只 将 cwnd 的 值 增加 一 个 MSS [RFC 5681 ] 。 这 能 够 以 几 种 方式 完 
成 。 一 种 通用 的 方法 是 对 于 TCP 发 送 方 无 论 何 时 到 达 一 个 新 的 确认 ， 就 将 cwnd 增加 一 个 
MSS (MSS/ewnd) 字 节 。 例 如 ， 如 果 MSS 是 1460 字 节 并 且 cwnd 是 14 600 字 节 ， 则 在 一 
个 RIT 内 发 送 10 个 报 文 段 。 每 个 到 达 ACK (假定 每 个 报 文 段 一 个 ACK) 增加 1/10MSS 
的 拥塞 窗口 长 度 ， 因 此 在 收 到 对 所 有 10 个 报 文 段 的 确认 后 ， 拥 塞 窗口 的 值 将 增加 了 一 
个 MSS 。 

但 是 何 时 应 当 结 束 拥塞 避免 的 线性 增长 (每 RTT IMSS) W? 当 出 现 超时 时 ，TCP 的 
拥塞 避免 算法 行为 相同 。 与 慢 启 动 的 情况 一 样 ，cwnd 的 值 被 设置 为 1 个 MSS， 当 丢 包 事件 
出 现时 ，ssthresh 的 值 被 更 新 为 cwnd 值 的 一 半 。 然 而 ， 前 面 讲 过 丢 包 事件 也 能 由 一 个 三 个 
TER ACK 事件 触发 。 在 这 种 情况 下 ， 网 络 继续 从 发 送 方 向 接收 方 交 付 报 文 段 (就 像 由 收 
到 元 余 ACK 所 指示 的 那样 )。 因 此 TCP 对 这 种 丢 包 事件 的 行为 ， 相 比 于 超时 指示 的 丢 包 ， 
应 当 不 那么 剧烈 : TCP 将 cwnd 的 值 减 半 〈 为 使 测量 结果 更 好 ， 计 及 已 收 到 的 3 个 宛 余 的 
ACK 要 加 上 3 个 MSS) ， 并 且 当 收 到 3 个 宛 余 的 ACK， 将 ssthresh 的 值 记 录 为 cwnd 的 值 的 
一 半 。 接 下 来 进入 快速 恢复 状态 。 

3. 快速 恢复 

在 快速 恢复 中 ， 对 于 引起 TCP 进入 快速 恢复 状态 的 缺失 报 文 段 ， 对 收 到 的 每 个 元 余 的 
ACK, cwnd 的 值 增加 一 个 MSS。 最 终 ， 当 对 丢失 报 文 段 的 一 个 ACK 到 达 时 ，TCP 在 降低 
cwnd 后 进入 拥塞 避免 状态 。 如 果 出 现 超时 事件 ， 快 速 恢复 在 执行 如 同 在 慢 启 动 和 拥塞 避 
免 中 相同 的 动作 后 ， 迁 移 到 慢 启 动 状态 : 当 丢 包 事 件 出 现时 ，cwnd 的 值 被 设置 为 1 个 
MSS, J-E. ssthresh 的 值 设 置 为 cwnd 值 的 一 半 。 

快速 恢复 是 TCP 推荐 的 而 非 必需 的 构件 [| RFC 5681 ] 。 有 趣 的 是 ， 一 种 称 为 TCP 
Tahoe 的 TCP 早期 版 本 ， 不 管 是 发 生 超时 指示 的 丢 包 事件 ， 还 是 发 生 3 AIR ACK 指示 
的 丢 包 事件 ， 都 无 条 件 地 将 其 拥塞 窗口 减 至 1 个 MSS， 并 进入 慢 启 动 阶段 。TCP 的 较 新 版 
本 TCP Reno， 则 综合 了 快速 恢复 。 


图 3-52 图 示 了 Reno 版 TCP 与 Tahoe 版 TCP 的 拥塞 控制 窗口 的 演化 情况 。 在 该 图 中 ， 
闵 值 初始 等 于 8 个 MSS。 在 前 8 个 传输 回 pe ee 
合 ，Tahoe 和 Reno 采取 了 相同 的 动作 。 
拥塞 窗口 在 慢 启动 阶段 以 指数 速度 快速 疏 
升 ， 在 第 4 轮 传 输 时 到 达 了 国 值 。 然 后 拥 
塞 窗 口 以 线性 速度 假 升 ， 直 到 在 第 8 轮 传 
输 后 出 现 3 个 宛 余 ACK。 注 意 到 当 该 丢 包 一 -有 一 
事件 发 生 时 ， 拥 塞 窗口 值 为 12 x MSS。 于 ee 
是 ssthresh 的 值 被 设置 为 0.5 xcwnd =6 x 
MSS, 在 TCP Pana F, 拥塞 窗口 被 设置 GC I 2S 4 SE L E pie 12 13: 14.15 
为 ewnd = 9MSS， 然 后 线性 地 增长 。 在 nee 

TCP Tahoe 下 ， 拥 塞 窗口 被 设置 为 1 个 fe] 3-52 TCP 拥塞 窗口 的 演化 (Tahoe 和 Reno) 
MSS， 然 后 呈 指 数 增长 ， 直 至 到 达 ssthresh 值 为 止 ， 在 这 个 点 它 开 始 线性 增长 。 

图 3-51 表示 了 TCP 拥塞 控制 算法 〈 即 慢 启动 、 拥 塞 避免 和 快速 恢复 ) 的 完整 FSM 描 
述 。 该 图 也 指示 了 新 报 文 段 的 传输 或 重 传 的 报 文 段 可 能 出 现 的 位 置 。 尽 管区 分 TCP 差错 控 
制 / 重 传 与 TCP 拥塞 控制 非常 重要 ,但 是 注意 到 TCP 这 两 个 方面 交织 链接 的 方式 也 很 
重要 。 

4. TCP 拥塞 控制 : 回顾 

在 深入 了 解 慢 启动 、 拥 塞 避 免 和 快速 恢复 的 细节 后 ， 现 在 有 必要 退回 来 回顾 一 下 全 
局 。 忽 略 一 条 连接 开始 时 初始 的 慢 启 动 阶段 ， 假 定 丢 包 由 3 SITAR AY ACK 而 不 是 超时 指 
RW, TCP 的 拥塞 控制 是 : 每 个 RTT 内 cwnd 线性 (加 性 ) 增加 1MSS， 然 后 出 现 3 个 宛 余 
ACK 事件 时 cwnd WE (RHEW) AE, TCP 拥塞 控制 常常 被 称 为 加 性 增 、 乘 性 减 
(Additive- Increase, Multiplicative- Decrease, AIMD) 拥塞 控制 方式 。AIMD 拥塞 控制 引发 了 
在 图 3-53 中 所 示 的 “锯齿 ”行为 ， 这 也 
很 好 地 图 示 了 我 们 前 面 TCP 检测 带宽 时 24K 
的 直觉 ， 即 TCP 线性 地 增加 它 的 拥塞 窗 oo 
口 长 度 〈 因 此 增加 其 传输 速率 ) ， 直 到 出 轿 16K 
现 3 个 宛 余 ACK 事件 。 然 后 以 2 个 因子 ~F 
来 减少 它 的 拥塞 窗口 长 度 ， 然 后 又 开始 了 8K 
线性 增长 ， 探 测 是 否 还 有 另外 的 可 用 

















拥塞 窗口 
(以 报 文 段 计 ) 





市 宽 。 
如 前 所 述 ， 许 多 TCP 实现 采用 了 Re- 
no 算法 [ Padhye 2001 ] Reno 算法 的 许 图 3-53 ”加 性 增 、 乘 性 减 的 拥塞 控制 


多 变种 已 被 提出 [RFC 3782; RFC 2018], TCP Vegas 算法 [Brakmo 1995; Ahn 1995] ix 
图 在 维持 较 好 的 吞吐 量 的 同时 避免 拥塞 。Vegas 的 基本 思想 是 : 山 在 分 组 丢失 发 生 之 前 ， 
在 源 与 目的 地 之 间 检 测 路 由 器 中 的 拥塞 ; @ 当 检测 出 快要 发 生 的 分 组 丢失 时 ， 线 性 地 降低 
发 送 速率 。 快 要 发 生 的 分 组 丢失 是 通过 观察 RTT 来 预测 的 。 分 组 的 RIT 越 长 ， 路 由 器 中 
的 拥塞 越 严重 。 到 2015 年 年 底 ，TCP 的 Ubuntu Linux 实现 默认 提供 了 慢 启动 、 拥 塞 避 免 、 
快速 恢复 、 快 速 重 传 和 SACK， 也 提供 了 诸如 TCP Vegas 和 BIC [Xu 2004] 等 其 他 拥塞 控 
制 算法 。 对 于 许多 特色 TCP 的 综述 参见 [Afanasyev 2010] 。 
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TCP AIMD 算法 基于 大 量 的 工程 见解 和 在 运行 网 络 中 的 拥塞 控制 经 验 而 开发 。 在 TCP 
研发 后 的 十 年 ， 理 论 分 析 显 示 TCP 的 拥塞 控制 算法 用 做 一 种 分 布 式 异步 优化 算法 ， 使 得 用 
户 和 网 络 性 能 的 几 个 重要 方面 被 同时 优化 [Kelly 1998 ] 。 拥 寨 控 制 的 丰富 理论 已 经 得 到 发 
展 [Srikant 2004 | 。 

5. 对 TCP 吞吐 量 的 宏观 描述 

给 出 TCP 的 锯齿 状 行为 后 ， 日 然 要 考虑 一 个 长 存活 期 的 TCP 连接 的 平均 吞吐 量 〈 即 
平均 速率 ) 可 能 是 多 少 。 在 这 个 分 析 中 ,我们 将 忽略 在 超时 事件 后 出 现 的 惕 启动 阶段 。 
(这 些 阶段 通常 非常 短 ， 因 为 发 送 方 很 快 就 以 指数 增长 离开 该 阶段 ,) 在 一 个 特定 的 往返 间 
A, TCP 发 送 数 据 的 速率 是 拥塞 窗口 与 当前 RTT eR. ABO KE Fy, AM 
前 往返 时 间 是 RTT PAT, W) TCP 的 发 送 速 率 大 约 是 w/RTT。 于 是 ，TCP 通过 每 经 过 1 个 
RTT 将 w 增加 1 个 MSS 探测 出 额外 的 带宽 ， 直 到 一 个 丢 包 事件 发 生 为 止 。 当 一 个 丢 包 事 
件 发 生 时 ， 用 更 表示 w 的 值 。 假 设 在 连接 持续 期 间 RTT 和 W JLE, ABA TCP 的 传输 
速率 在 W/(2x RIT) 到 W/RTT 之 间 变 化 。 

这 些 假设 导出 了 TCP 稳 态 行为 的 一 个 高 度 简 化 的 宏观 模型 。 当 速率 增长 至 W/RIT 时 ， 
网 络 丢弃 来 自 连接 的 分 组 ; 然后 发 送 速 率 就 会 减 半 ， 进 而 每 过 一 个 RTT 就 发 送 速率 增加 
MSS/RTT， 直 到 再 次 达到 W/RTT 为 止 。 这 一 过 程 不 断 地 自我 重复 。 因 为 TCP iti ( 即 
速率 ) 在 两 个 极 值 之 间 线 性 增长 ， 所 以 我 们 有 

Ota WwW 


REBATE AEE = 一 RTT 


通过 这 个 高 度 理 想 化 的 TCP 稳 态 动态 性 模型 ， 我 们 可 以 推出 一 个 将 连接 的 丢 包 率 与 可 
用 带宽 联系 起 来 的 有 趣 表达 式 [| Mahdavi 1997 ] 。 这 个 推导 将 在 课 后 习题 中 概要 给 出 。 一 
个 根据 经 验 建 立 的 并 与 测量 数据 一 致 的 更 复杂 模型 参见 Padhye 2000 | 。 

6. 经 高 带宽 路 径 的 TCP 

认识 到 下 列 事实 是 重要 的 : TCP 拥塞 控制 已 经 演化 了 多 年 并 仍 在 继续 演化 。 对 当前 
TCP 变量 的 总 结 和 TCP 演化 的 讨论 ， 参 见 [ Floyd 2001; RFC 5681; Afanasyev 2010], VJ 
往 对 因特网 有 益 的 东西 〈 那 时 大 量 的 TCP 连接 承载 的 是 SMTP、FTP Fil Telnet 流量 ) ， 不 一 
定 对 当今 HTTP 主宰 的 因特网 或 具有 难以 想象 的 服务 的 未 来 因特网 还 是 有 益 的 。 

TCP 继续 演化 的 需求 能 够 通过 考虑 网 格 和 云 计 算 应 用 所 需要 的 高 速 TCP E BE A 
述 。 例 如 ， 考 虑 一 条 具有 1500 字 节 报 文 段 和 100ms RTT 的 TCP 连接 ， 假 定 我 们 要 通过 这 
条 连接 以 10Gbps 速率 发 送 数据 。 根 据 [RFC 3649 | ， 我 们 注意 到 使 用 上 述 TCP FEA 
式 ， 为 了 取得 10Gbps 吞吐 量 ， 平 均 拥塞 窗口 长 度 将 需要 是 83 333 个 报 文 段 。 对 如 此 大 量 
的 报 文 段 ， 使 我 们 相当 关注 这 83 333 个 传输 中 的 报 文 段 也 许 会 丢失 。 在 丢失 的 情况 下 ， 将 
会 出 现 什 么 情况 呢 ? 或 者 以 另 一 种 方式 说 ， 这 些 传 输 的 报 文 段 能 以 何 种 比例 丢失 ， 使 得 在 
图 3-52 中 列 出 的 TCP 拥塞 控制 算法 仍 能 取得 所 希望 的 10Cbps 速率 ”在 本 章 的 课 后 习题 
中 ， 要 求 读者 推导 出 一 条 TCP 连接 的 吞吐 量 公 式 ， 该 公式 作为 丢 包 率 (L), WER hti 
(RIT) 和 最 大 报 文 段 长 度 (MSS) 的 函数 : 


1. 22 x MSS 
RTT WL. 
使 用 该 公式 ， 我 们 能 够 看 到 ， 为 了 取得 10Gbps 的 吞吐 量 ， 今 天 的 TCP 拥塞 控制 算法 


一 条 连接 的 平均 吞吐 量 = 


仅 能 容忍 2x10 “的 报 文 段 丢 失 概率 (或 等 价 地 说 ， 对 每 5 000 000 000 个 报 文 段 有 一 个 丢 
包 ) ， 这 是 一 个 非常 低 的 值 。 这 种 观察 导致 许多 研究 人 员 为 这 种 高 速 环境 特别 设计 新 版 
TCP， 对 这 些 努力 的 讨论 参见 [Jin 2004; Kelly 2003; Ha 2008; RFC 7323]. 


3.7.1 公平 性 


考虑 KK 条 TCP 连接 ， 每 条 都 有 不 同 的 端 到 端 路 径 ， 但 是 都 经 过 一 段 传输 速率 为 R bps 
的 瓶颈 链 路 。( 所 谓 瓶 颈 链 路 ， 是 指 对 于 每 条 连接 ， 沿 着 该 连接 路 径 上 的 所 有 其 他 段 链 路 
都 不 拥塞 ， 而 且 与 该 瓶颈 链 路 的 传输 容量 相 比 ， 它 们 都 有 充足 的 传输 容量 。) 假设 每 条 连 
接 都 在 传输 一 个 大 文件 ， 而 且 无 UDP 流量 通过 该 段 瓶颈 链 路 。 如 果 每 条 连接 的 平均 传输 
速率 接近 RMLK， 即 每 条 连接 都 得 到 相同 份额 的 链 路 带宽 ， 则 认为 该 拥塞 控制 机 制 是 公 
平 的 。 

TCP 的 AIMD 算法 公平 吗 ? 尤其 是 假定 可 在 不 同时 间 局 动 并 因此 在 某 个 给 定 的 时 间 点 
可 能 具有 不 同 的 窗口 长 度 情况 下 ， 对 这 些 
不 同 的 TCP 连接 还 是 公平 的 吗 ? TCP 趋 于 
在 竞争 的 多 条 TCP 连接 之 间 提 供 对 一 段 瓶 
颈 链 路 带宽 的 平等 分 享 ， 其 理由 Chiu 
1989] 给 出 了 一 个 极 好 的 、 直 观 的 解释 。 

我 们 考虑 有 两 条 TCP 连接 共享 一 段 传 
输 速 率 为 民 的 链 路 的 简单 例子 ， 如 图 3-54 TCP HERI 
中 所 示 。 我 们 将 假设 这 两 条 连接 有 相同 的 图 3-54 ”两 条 TCP 连接 共享 同一 条 瓶颈 链 路 
MSS 和 RTT (这 样 如 果 它 们 有 相同 的 拥塞 
窗口 长 度 ， 就 会 有 相同 的 吞吐 量 ) ， 它 们 有 
大 量 的 数据 要 发 送 ， 且 没有 其 他 TCP 连接 
或 UDP 数据 报 穿越 该 段 共 享 链 路 。 我 们 还 iain 
将 忽略 TCP 的 慢 启 动 阶段 ， 并 假设 TCP 连 iii 
接 一 直 按 CA 模式 (AIMD) 运行 。 

图 3-55 描绘 了 两 条 TCP EREMIE 
吐 量 情况 。 如 果 TCP 要 在 这 两 条 TCP 连接 
之 间 平 等 地 共享 链 路 带宽 ， 那 么 实现 的 否 
吐 量 曲 线 应 当 是 从 原点 沿 45° 方 向 的 箭头 问 
外 辐射 (平等 带宽 共享 )。 理 想 情况 是 ， 两 
个 吞吐 量 的 和 应 等 于 尺 。 ( 当然 ， 每 条 连接 
得 到 相同 但 容量 为 0 的 共享 链 路 容量 并 非 
我 们 所 期 望 的 情况 !) 所 以 我 们 的 目标 应 该 
是 使 取得 的 吞吐 量 落 在 图 3-55 中 平等 带宽 图 3-55 TCP 连接 1 和 连接 2 实现 的 吞吐 量 
共享 曲线 与 全 带宽 利用 曲线 的 交叉 点 附近 的 某 处 。 

假定 TCP 窗口 长 度 是 这 样 的 ， 即 在 某 给 定时 刻 ， 连 接 1 和 连接 2 实现 了 由 图 3-55 PA 
点 所 指明 的 吞吐 量 。 因 为 这 两 条 连接 共同 消耗 的 链 路 带宽 量 小 于 R, 所 以 无 丢 包 事件 发 
Æ, 根据 TCP 的 拥塞 避免 算法 的 结果 ， 这 两 条 连接 每 过 一 个 RTT 都 要 将 其 窗口 增加 1 个 
MSS。 因 此 ， 这 两 条 连接 的 总 吞吐 量 就 会 从 A 点 开始 沿 45° 线 前 行 (两 条 连接 都 有 相同 的 
增长 ) 。 最 终 ， 这 两 条 连接 共同 消耗 的 带宽 将 超过 R， 最 终 将 发 生 分 组 丢失 。 假 设 连 接 1 





TCP 连 接 2 a 







连接 2 的 吞吐 量 


连接 1 的 吞吐 量 R 


和 连接 2 实现 B 点 指明 的 吞吐 量 时 ， 它 们 都 经 历 了 分 组 丢失 。 连 接 1 和 连接 2 于 是 就 按 二 
分 之 一 减 小 其 窗口 。 所 产生 的 结果 实现 了 C 点 指明 的 吞吐 量 ， 它 正好 位 于 始 于 B 点 止 于 原 
点 的 一 个 向 量 的 中 间 。 因 为 在 C 点 ,共同 消耗 的 带宽 小 于 尽 ， 所 以 这 两 条 连接 再 次 沿 着 始 
于 C 点 的 45? 线 增加 其 吞吐 量 。 最 终 ， 再 次 发 生 丢 包 事 件 ， 如 在 D 点 ， 这 两 条 连接 再 次 将 
其 窗口 长 度 减 半 ， 如 此 等 等 。 你 应 当 搞 清楚 这 两 条 连接 实现 的 高 宽 最 终 将 沿 着 平等 带宽 共 
享 曲线 在 波动 。 还 应 该 搞 清楚 无 论 这 两 条 连接 位 于 二 维 空间 的 何 处 ， 它 们 最 终 都 会 收敛 到 
该 状态 ! 虽然 此 时 我 们 做 了 许多 理想 化 的 假设 , 但 是 它 仍 然 能 对 解释 为 什么 TCP 会 导致 在 
多 条 连接 之 间 的 平等 共享 带宽 这 个 问题 提供 一 个 直观 的 感觉 。 

在 理想 化 情形 中 ， 我 们 假设 仅 有 TCP 连接 穿 过 瓶 贷 链 路 ， 所 有 的 连接 具有 相同 的 RTT 
值 ， 且 对 于 一 个 主机 - 目的 地 对 而 言 只 有 一 条 TCP 连接 与 之 相关 联 。 实 践 中 ， 这 些 条 件 通 
BEA STAN, AP -服务 器 应 用 因此 能 获得 非常 不 平等 的 链 路 市 宽 份 额 。 特 别 是 ， 
已 经 表明 当 多 条 连接 共享 一 个 共同 的 瓶颈 链 路 时 ， 那 些 具 有 较 小 RTT 的 连接 能 够 在 链 路 空 
闲 时 更 快 地 抢 到 可 用 带宽 〈 即 较 快 地 打开 其 拥塞 窗口 ) ， 因 而 将 比 那些 具有 较 大 RTT 的 连 
接 享 用 更 高 的 吞吐 量 | Laksman 1997 | 。 

1. 公平 性 和 UDP 

我 们 刚才 已 经 看 到 ，TCP 拥塞 控制 是 如 何 通过 拥塞 窗口 机 制 来 调节 一 个 应 用 程序 的 传 
输 速 率 的 。 许 多 多 媒体 应 用 如 因特网 电话 和 视频 会 议 ， 经 向 就 因为 这 种 特定 原因 而 不 在 
TCP 上 运行 ， 因 为 它们 不 想 其 传输 速率 被 扼 制 ， 即 使 在 网 络 非常 拥塞 的 情况 下 。 相 反 ， 这 
些 应 用 宁可 在 UDP 上 运行 ，UDP 是 没有 内 置 的 拥塞 控制 的 。 当 运行 在 UDP 上 时 ， 这 些 应 
用 能 够 以 恒定 的 速率 将 其 音频 和 视频 数据 注入 网 络 之 中 并 且 偶 尔 会 丢失 分 组 ， 而 不 愿 在 拥 
塞 时 将 其 发 送 速率 降 至 “公平 ”级 别 并 且 不 丢失 任何 分 组 。 从 TCP 的 观点 来 看 ， 运 行 在 
UDP 上 的 多 媒体 应 用 是 不 公平 的 ， 因 为 它们 不 与 其 他 连接 合作 ， 也 不 适时 地 调整 其 传输 速 
K, AA TCP 拥塞 控制 在 面临 拥塞 增加 〈 丢 包 ) 时 ， 将 降低 其 传输 速率 ， 而 UDP 源 则 不 
必 这 样 做 ，UDP 源 有 可 能 压制 TCP 流量 。 当 今 的 一 个 主要 研究 领域 就 是 开发 一 种 因特网 
中 的 拥塞 控制 机 制 ， 用 于 阻止 UDP 流量 不 断 压制 直至 中 断 因特网 吞吐 量 的 情况 [Floyd 
1999; Floyd 2000; Kohler 2006; RFC 4340] 。 


2. 公平 性 和 并 行 TCP 连接 

即使 我 们 能 够 迫使 UDP 流量 具有 公平 的 行为 ， 但 公平 性 问题 仍然 没有 完全 解决 。 这 
是 因为 我 们 没有 什么 办 法 阻止 基于 TCP 的 应 用 使 用 多 个 并 行 连接 。 例 如 ，Web Wi bt aiid Ay 
使 用 多 个 并 行 TCP 连接 来 传送 一 个 Web 页 中 的 多 个 对 象 。( 多 条 连接 的 确切 数目 可 以 在 多 
数 浏 览 器 中 进行 配置 。) 当 一 个 应 用 使 用 多 条 并 行 连接 时 ， 它 占用 了 一 条 拥塞 链 路 中 较 大 
比例 的 带宽 。 举 例 来 说 ， 考 虑 一 段 速率 为 RR 且 支 持 9 个 在 线 客户 -服务 顺应 用 的 链 路 ， 每 
个 应 用 使 用 一 条 TCP 连接 。 如 果 一 个 新 的 应 用 加 入 进来 ， 也 使 用 一 条 TCP 连接 ， 则 每 个 
应 用 得 到 差不多 相同 的 传输 速率 RA10。 但 是 如 果 这 个 新 的 应 用 这 次 使 用 了 11 个 并 行 TCP 
连接 ， 则 这 个 新 应 用 就 不 公平 地 分 到 超过 R/2 的 带宽 。Web 流量 在 因特网 中 是 非常 普遍 
的 ， 所 以 多 条 并 行 连接 并 非 不 常见 。 


3.7.2 明确 拥塞 通告 : 网 络 辅助 拥塞 控制 


自 20 世纪 80 年 代 后 期 慢 启动 和 拥塞 避免 开始 标准 化 以 来 [RFC 1122], TCP 已 经 实 
现 了 端 到 端 拥塞 控制 的 形式 ， 我 们 在 3. 7. 1 节 中 对 此 进行 了 学 习 : 一 个 TCP 发 送 方 不 会 收 


到 来 自 网 络 层 的 明确 拥塞 指示 ， 而 是 通过 观察 分 组 丢失 来 推断 拥塞 。 最 近 ， 对 于 IP 和 
TCP 的 扩展 方案 [RFC 3168) 已 经 提出 并 已 经 实现 和 部 署 ， 该 方案 允许 网 络 明 确 向 TCP 
发 送 方 和 接收 方 发 出 拥塞 信号 。 这 种 形式 的 网 络 辅助 拥塞 控制 称 为 明确 拥塞 通告 (Explicit 
Congestion Notification ，ECN ) 。 如 图 3-56 所 示 ， 涉 及 了 TCP Al IP 协议。 


在 接收 方 到 发 送 方 的 TCP ACK 
报 文 段 中 设置 ECN 回 显 比特 


主机 A / 主机 B 


E 一 [ECN Echo=l E 








在 拥塞 路 由 器 的 IP 数 据 
报 首部 设置 ECN 比 特 


图 3-56 ”明确 拥塞 通告 : 网 络 辅助 拥塞 控制 


在 网 络 层 ，IP 数据 报 首部 的 服务 类 型 字段 中 的 两 个 比特 〈 总 的 说 来 ， 有 四 种 可 能 的 
值 ) 被 用 于 ECN。 路 由 器 所 使 用 的 一 种 ECN 比特 设置 指示 该 路 由 器 正在 历经 拥塞 。 该 拥 
塞 指示 则 由 被 标记 的 IP 数据 报 所 携带 ， 送 给 目的 主机 ， 再 由 目的 主机 通知 发 送 主机 ， 如 
图 3-56 所 示 。RFC 3168 没有 提供 路 由 器 拥塞 时 的 定义 ; 该 判断 是 由 路 由 器 广 商 所 做 的 配 
置 选择 ， 并 且 由 网 络 操作 员 决 定 。 然 而 ，RFC 3168 推荐 仅 当 拥塞 持续 不 断 存 在 时 才 设 置 
ECN 比特 。 发 送 主机 所 使 用 的 另 一 种 ECN 比特 设置 通知 路 由 器 发 送 方 和 接收 方 是 ECN 使 
能 的 ， 因 此 能 够 对 于 ECN 指示 的 网 络 拥塞 采取 行动 。 

如 图 3-56 所 示 ， 当 接收 主机 中 的 TCP 通过 一 个 接收 到 的 数据 报 收 到 了 一 个 ECN 拥塞 
指示 时 ， 接 收 主机 中 的 TCP 通过 在 接收 方 到 发 送 方 的 TCP ACK 报 文 段 中 设置 ECE (明确 
拥塞 通告 回 显 ) 比特 (参见 图 3-29)， 通知 发 送 主 机 中 的 TCP 收 到 拥塞 指示 。 接 下 来 ， 
TCP 发 送 方 通过 减 半 拥塞 窗口 对 一 个 具有 ECE 拥塞 指示 的 ACK 做 出 反应 ， 就 像 它 对 丢失 
报 文 段 使 用 快速 重 传 做 出 反应 一 样 ， 并 且 在 下 一 个 传输 的 TCP 发 送 方 到 接收 方 的 报 文 段 首 
部 中 对 CWR (拥塞 窗口 缩减 ) 比特 进行 设置 。 

除了 TCP 以 外 的 其 他 运输 层 协议 也 可 以 利用 网 络 层 发 送 ECN 信号 。 数 据 报 拥塞 控制 
协议 (Datagram Congestion Control Protocol, DCCP) | RFC 4340] 提供 了 一 种 低 开 销 、 控 制 
拥塞 的 类 似 UDP 不 可 靠 服务 ,该 协议 利用 了 ECN。DCTCP (数据 中 心 TCP) [Alizadeh 
2010] 是 一 种 专门 为 数据 中 心 网 络 设计 的 TCP 版 本 ， 也 利用 了 ECN, 


3.8 小 结 


本 草 我 们 首先 学 习 了 运输 层 协议 能 够 辐 网络 应 用 程序 提供 的 服务 。 在 一 个 极端 ， 运 输 
层 协议 非常 简单 ， 并 向 应 用 程序 不 提供 不 必要 的 服务 ， 而 仅 向 通信 进程 提供 多 路 复 用 /分 
解 的 功能 。 因 特 网 中 的 UDP 协议 就 是 这 样 一 种 不 提供 不 必要 服务 的 运输 层 协议 。 在 男 一 
个 极端 ， 运 输 层 协议 能 够 回应 用 程序 提供 各 种 各 样 的 保证 ， 例 如 数据 的 可 靠 交 付 、 时 延 保 
证 和 带宽 保证 。 无 论 如 何 ， 运输 层 协议 能 够 提供 的 服务 经 常 受 下 面 网 络 层 协议 服务 模型 的 
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限制 。 如 果 网 络 层 协议 不 能 向 运输 层 报 文 段 提 供 时 延 或 带宽 保证 ， 那 么 运输 层 协议 就 不 能 
向 进程 间 发 送 的 报 文 提供 时 延 或 带宽 保证 。 

在 3.4 节 中 ， 我们 学 习 了 运输 层 协议 能 够 提供 可 靠 数 据 传输 ， 即 使 下 面 的 网 络 层 是 不 
可 靠 的 。 我 们 看 到 了 提供 可 靠 的 数据 传送 会 遇 到 许多 微妙 的 问题 ， 但 都 可 以 通过 精心 地 结 
合 确认 、 定 时 器 、 重 传 以 及 序号 机 制 来 完成 任务 。 

尽管 在 本 章 中 我 们 包含 了 可 靠 数据 传 送 ， 但 是 我 们 应 该 理解 在 链 路 层 、 网 络 层 、 运 输 
层 或 应 用 层 协议 中 都 可 以 提供 可 靠 数据 传送 。 该 协议 栈 中 上 面 4 层 的 任意 一 层 都 可 以 实现 
确认 、 定 时 器 、 重 传 以 及 序号 ， 能 够 向 其 上 层 提 供 可 靠 数 据 传 送 。 事 实 上， 在 过 去 数 年 
中 ， 工 程 师 以 及 计算 机 科学 家 们 已 经 独立 地 设计 并 实现 了 提供 可 靠 数 据 传 送 的 链 路 层 、 网 
络 层 、 运 输 层 以 及 应 用 层 协议 (虽然 这 些 协议 中 的 许多 已 经 销声匿迹 了 )， 

在 3.5 节 中 ， 我 们 详细 地 研究 了 TCP 协议 ， 它 是 因特网 中 面向 连接 和 可 靠 的 运输 层 协 
议 。 我 们 知道 TCP 是 非常 复杂 的 ， 它 涉及 了 连接 管理 、 流 量 控制 、 往 返 时 间 估 计 以 及 可 徘 
数据 传送 。 事 实 上 ，TCP 比 我 们 描述 的 要 更 为 复杂 ， 即 我 们 有 意 地 避 而 不 谈 在 各 种 TCP 实 
现 版 本 中 广泛 实现 的 各 种 TCP 补丁 、 修 复 和 改进 。 然 而 ， 所 有 这 些 复杂 性 都 对 网 络 层 应 用 
隐藏 了 起 来 。 如 果 某 主机 上 的 客户 硕 望 向 另 一 台 主 机 上 的 服务 器 可 靠 地 发 送 数据 ， 它 只 需 
要 打开 对 该 服务 器 的 一 个 TCP 套 接 字 ， 然 后 将 数据 注入 该 套 接 字 。 客 户 -RI a ni HEEN 
则 乐于 对 TCP 的 复杂 性 视而不见 。 

在 3.6 节 中 ， 我 们 从 广泛 的 角度 研究 了 拥塞 控制 ， 在 3.7 节 中 我 们 阐述 了 TCP 是 如 何 
实现 拥塞 控制 的 。 我 们 知道 了 拥塞 控制 对 于 网 络 恨 好 运行 是 必 不 可 少 的 。 没 有 拥塞 控制 ， 
网 络 很 容易 出 现 死 锁 ， 使 得 端 到 端 之 间 很 少 或 没有 数据 能 被 传输 。 在 3.7 市 中 我 们 学 习 了 
TCP 实现 的 一 种 端 到 端 拥塞 控制 机 制 ， 即 当 TCP 连接 的 路 径 上 判断 不 拥塞 时 ， 其 传输 速率 
就 加 性 增 ; 当 出 现 丢 包 时 ， 传 输 速 率 就 乘 性 减 。 这 种 机 制 也 致力 于 做 到 每 一 个 通过 拥塞 链 
路 的 TCP 连接 能 平等 地 共享 该 链 路 带宽 。 我 们 也 深入 探讨 了 TCP 连接 建立 和 慢 启 动 对 时 
延 的 影响 。 我 们 观察 到 在 许多 重要 场合 ， 连 接 建立 和 慢 启 动 会 对 端 到 端 时 延 产 生 严 重 影 
响 。 我 们 再 次 强调 ， 尽 管 TCP 在 这 几 年 一 直 在 发 展 ， 但 它 仍 然 是 一 个 值得 深入 研究 的 领 
域 ， 并 且 在 未 来 的 几 年 中 还 可 能 持续 演化 。 

在 本 章 中 我 们 对 特定 因特网 运输 协议 的 讨论 集中 在 UDP 和 TCP E, 它们 是 因特网 运 
输 层 的 两 号 “ 驮 马 ” 。 然 而 ， 对 这 两 个 协议 的 二 十 多 年 的 经 验 已 经 使 人 们 认识 到 ， 这 两 个 
协议 都 不 是 完美 无 缺 的 。 研 究 人 员 因 此 在 忙于 研制 其 他 的 运输 层 协 议 ， 其 中 的 几 种 现在 已 
经 成 为 IETF 建议 的 标准 。 

数据 报 拥塞 控制 协议 (Datagram Congestion Control Protocol, DCCP) [RFC 4340] 提供 
了 一 种 低 开 销 、 面 向 报 文 、 类 似 于 UDP 的 不 可 靠 服 务 ， 但 是 具有 应 用 程序 可 选择 的 拥塞 
控制 形式 ， 该 机 制 与 TCP 相 兼 容 。 如 果 某 应 用 程序 需要 可 靠 的 或 半 可 靠 的 数据 传送 ， 则 这 
将 在 应 用 程序 自身 中 执行 (也 许 使 用 我 们 已 经 在 3.4 节 中 学 过 的 机 制 ) 。DCCP 被 设想 用 
于 诸如 流 媒体 (参见 第 9 章 ) 等 应 用 程序 中 ，DCCP 能 够 利用 数据 交付 的 预定 时 间 和 可 靠 
性 之 间 的 折 中 ， 但 是 要 对 网 络 拥塞 做 出 啊 应 。 

在 谷歌 的 Chromium 浏览 器 中 实现 了 QUIC (Quick UDP Internet Connections) 协议 
[Iyengar 2016 ] ， 该 协议 通过 重 传 以 及 差错 检测 、 快 速 连接 建立 和 基于 速率 的 拥塞 控制 算 
法 提供 可 靠 性 ， 而 基于 速率 的 拥塞 控制 算法 是 以 TCP 友好 特性 为 目标 ， 这 些 机 制 都 是 在 
UDP 之 上 作为 应 用 层 协议 实现 的 。2015 年 年 初 ， 谷 歌 报 告 从 Chrome 浏览 硕 到 谷歌 服务 天 
的 大 约 一 半 请 求 运 行 在 QUIC 之 上 。 
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DCTCP (数据 中 心 TCP) [Alizadeh 2010] 是 一 种 专门 为 数据 中 心 网 络 设计 的 TCP 版 
本 ,使 用 ECN 以 更 好 地 支持 短 流 和 长 流 的 混合 流 ， 这 种 混合 流 代 表 了 数据 中 心 负载 的 
特征 。 

流 控制 传输 协议 (Stream Control Transmission Protocol, SCTP)[ RFC 4960, RFC 3286 | 
是 一 种 可 靠 的 、 面 向 报 文 的 协议 ， 该 协议 允许 几 个 不 同 的 应 用 层次 的 “ 流 ” 复 用 到 单个 
SCTP 连接 上 (一 种 称 之 为 “多 流 ” 的 方法 )。 从 可 靠 性 的 角度 看 ， 在 该 连接 中 的 不 同 流 
被 分 别处 理 ， 因 此 在 一 条 流 中 的 分 组 丢失 不 会 影响 其 他 流 中 数据 的 交付 。 当 一 台 主 机 与 两 
个 或 更 多 个 网 络 连接 时 ，SCTP 也 允许 数据 经 两 条 出 路 径 传 输 ， 还 具有 失 序 数据 的 选项 交 
付 和 一 些 其 他 特色 。SCTP 的 流 控 制 和 拥塞 控制 算法 基本 上 与 TCP 中 的 相同 。 

TCP 友好 速率 控制 (TCP- Friendly Rate Control, TFRC) 协议 [RFC 5348] 是 一 种 拥 
塞 控制 协议 而 不 是 一 种 功能 齐全 的 运输 层 协议 。 它 定义 了 一 种 拥塞 控制 机 制 ， 该 机 制 能 被 
用 于 诸如 DCCP 等 其 他 运输 协议 (事实 上 在 DCCP 中 可 供 使 用 的 两 种 应 用 程序 可 选 的 协议 
之 一 就 是 TFRC ) TFRC 的 目标 是 平滑 在 TCP 拥塞 控制 中 的 “锯齿 ”行为 《参见 
图 3-53) ， 同 时 维护 一 种 长 期 的 发 送 速 率 ， 该 速率 “合理 地 ”接近 TCP 的 速率 。 使 用 比 
TCP 更 为 平滑 的 发 送 速率 ，TFRC 非常 适合 诸如 IP 电话 或 流 媒 体 等 多 媒体 应 用 ， 这 种 平滑 
的 速率 对 于 这 些 应 用 是 重要 的 。TFRC 是 一 种 “基于 方程 ”的 协议 ， 这 些 协议 使 用 测 得 的 
技 包 率 作 为 方程 的 输入 [Padhye 2000], ， 即 使 用 方程 估计 一 个 TCP 会 话 在 该 丢 包 率 下 TCP 
的 吞吐 量 将 是 多 大 。 该 速率 则 被 取 为 TFRC 的 目标 发 送 速 率 。 

唯 有 未 来 才能 告诉 我 们 DCCP, SCTP, QUIC 或 TFRC 是 否 能 得 到 广泛 实施 。 虽 然 这 些 
协议 明确 地 提供 了 超过 TCP 和 UDP 的 强化 能 力 ， 但 是 多 年 来 已 经 证 明了 TCP 和 UDP 目 身 
是 “足够 好 ”的 。 是 否 “更 好 ”将 胜出 “足够 好 ”， 这 将 取决 于 技术 、 社 会 和 商业 考虑 的 
复杂 组 合 。 

在 第 1 章 中 ， 我 们 讲 到 计算 机 网 络 能 被 划分 成 “网 络 边缘 ”和 “网 络 核心 ”。 网 络 边 
缘 包 含 了 在 端 系统 中 发 生 的 所 有 事情 。 既 然 已 经 覆盖 了 应 用 层 和 运输 层 ， 我 们 关于 网 络 边 
缘 的 讨论 也 就 结束 了 。 接 下 来 是 探寻 网 络 核心 的 时 候 了 ! 我 们 的 旅程 从 下 一 章 开 始 ， 下 一 
章 将 学 习 网 络 层 ， 并 且 将 在 第 6 草 继 续 学 习 链 路 层 。 


课 后 习题 和 问题 
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Rl. 假定 网 络 层 提供 了 下 列 服务 。 在 源 主机 中 的 网 络 层 接受 最 大 长 度 1200 字 节 和 来 自 运输 层 的 目的 主机 
地 址 的 报 文 段 。 网 络 层 则 保证 将 该 报 文 段 交付 给 位 于 目的 主机 的 运输 层 。 假 定 在 目的 主机 上 能 够 运 
行 许多 网 络 应 用 进程 。 

a. 设计 可 能 最 简单 的 运输 层 协议 ,该 协议 将 使 应 用 程序 数据 到 达 位 于 目的 主机 的 所 希望 的 进程 。 假 
没 在 目的 主机 中 的 操作 系统 已 经 为 每 个 运行 的 应 用 进程 分 配 了 一 个 4 字 节 的 端口 号 。 

b. 修改 这 个 协议 ,使 它 向 目的 进程 提供 一 个 的 “返回 地 址 ”。 

c. 在 你 的 协议 中 ， 该 运输 层 在 计算 机 网 络 的 核心 中 “必须 做 任何 事 ” 吗 ? 

R2. 考虑 有 一 个 星球 ， 每 个 人 都 属于 某 个 六 口 之 家 ， 每 个 家 庭 都 住 在 自己 的 房子 里 ， 每 个 房子 都 一 个 唯 
一 的 地 址 ， 并 且 某 给 定 家 庭 中 的 每 个 人 有 一 个 独特 的 名 字 。 假 定 该 星球 有 一 个 从 源 家 庭 到 目的 家 庭 
交付 信件 的 邮政 服务 。 该 邮件 服务 要 求 : 山 在 一 个 信封 中 有 一 封 信 ; 包 在 信封 上 清楚 地 写 上 目的 家 
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庭 的 地 址 〈 并 且 没 有 别 的 东西 ) 。 假 设 每 个 家 庭 有 一 名 家 庭 成 员 代 表 为 家 庭 中 的 其 他 成 员 收 集 和 分 

发 信件 。 这 些 信 没有 必要 提供 任何 有 关 信 的 接收 者 的 指示 。 

a. 使 用 对 上 面 复 习题 R1 的 解决 方案 作为 启发 ， 描 述 家 庭 成 员 代表 能 够 使 用 的 协议 ， 以 从 发 送 家 庭 
成 员 向 接收 家 庭 成 员 交 付 信 件 。 

b. 在 你 的 协议 中 ,该 邮政 服务 必须 打开 信封 并 检查 信件 内 容 才 能 提供 它 的 服务 吗 ? 

R3. 考虑 在 主机 A 和 主机 了 之 间 有 一 条 TCP 连接 。 假 设 从 主机 A 传送 到 主机 B 的 TCP 报 文 段 具有 源 端 口 
号 x 和 目的 端口 号 y。 对 于 从 主机 B 传送 到 主机 A 的 报 文 段 ， 源 端口 号 和 目的 端口 号 分 别 是 多 少 ? 

R4. 描述 应 用 程序 开发 者 为 什么 可 能 选择 在 UDP 上 运行 应 用 程序 而 不 是 在 TCP 上 运行 的 原因 。 

RS. 在 今天 的 因特网 中 ， 为 什么 语音 和 图 像 流量 常常 是 经 过 TCP 而 不 是 经 UDP Riž, (提示 : 我 们 寻找 
的 答案 与 TCP 的 拥塞 控制 机 制 没 有 关系 。) 

R6. 当 某 应 用 程序 运行 在 UDP 上 时 ， 该 应 用 程序 可 能 得 到 可 靠 数据 传输 吗 ? 如 果 能 ， 如 何 实现 ? 

R7. 假定 在 主机 C 上 的 一 个 进程 有 一 个 具有 端口 号 6789 的 UDP 套 接 字 。 假 定 主 机 A 和 主机 B 都 用 目的 
端口 号 6789 回 主 机 C 发 送 一 个 UDP 报 文 段 。 这 两 台 主 机 的 这 些 报 文 段 在 主机 C 都 被 描述 为 相同 的 
套 接 字 吗 ? 如 果 是 这 样 的 话 ， 在 主机 C 的 该 进程 将 怎样 知道 源 于 两 台 不 同 主机 的 这 两 个 报 文 段 ? 

R8. 假定 在 主机 C 端口 80 上 运行 的 一 个 Web 服务 器 。 假 定 这 个 Web 服务 器 使 用 持续 连接 ， 并 且 正 在 接 
收 来 自 两 台 不 同 主机 A 和 B 的 请 求 。 被 发 送 的 所 有 请 求 都 通过 位 于 主机 C 的 相同 套 接 字 吗 ? MRE 
们 通过 不 同 的 套 接 字 传递 ， 这 两 个 套 接 字 都 具有 端口 80 吗 ? 讨论 和 解释 之 . 

3.4 节 

R9. 在 我 们 的 rdt 协议 中 ， 为 什么 需要 引入 序号 ? 

R10. 在 我 们 的 rdt 协议 中 ， 为 什么 需要 引入 定时 器 ? 

R11. 假定 发 送 方 和 接收 方 之 间 的 往返 时 延 是 固定 的 并 且 为 发 送 方 所 知 。 假 设 分 组 能 够 丢失 的 话 ， 在 协议 

rdt3.0 中 ， 一 个 定时 器 仍 是 必需 的 吗 ? 试 解 释 之 。 

R12. 在 配套 网 站 上 使 用 Co- Back-N (EHE N 45) Java 小 程序 。 

a. 让 源 发 送 5 个 分 组 ， 在 这 5 个 分 组 的 任何 一 个 到 达 目 的 地 之 前 暂停 该 动画 。 然 后 毁 掉 第 一 个 分 组 
并 继续 该 动画 。 试 描述 发 生 的 情况 。 

b. 重复 该 实验 ， 只 是 现在 让 第 一 个 分 组 到 达 目 的 地 并 毁 掉 第 一 个 确认 。 再 次 描述 发 生 的 情况 。 

c. 最 后 ， 尝 试 发 送 6 个 分 组 。 发 生 了 什么 情况 ? 

R13. 重复 复习 题 R12， 但 是 现在 使 用 Selective Repeat (选择 重 传 ) Java 小 程序 。 选 择 重 传 和 回 退 NHA 

什么 不 同 ? 

3.5 P 

R14. 是 非 判断 题 : 

a. 主机 A 经 过 一 条 TCP 连接 向 主机 B 发 送 一 个 大 文件 。 假 设 主机 B 没有 数据 发 往 主机 A. AWE 
机 B 不 能 随 数 据 朱 带 确认 ， 所 以 主机 B 将 不 向 主机 A 发 送 确 认 。 

b. 在 连接 的 整个 过 程 中 ，TCP 的 rwnd 的 长 度 决 不 会 变化 。 

c. 假设 主机 A 通过 一 条 TCP 连接 向 主机 B 发 送 一 个 大 文件 。 主 机 A 发 送 但 未 被 确认 的 字 节 数 不 会 
超过 接收 缓存 的 大 小 。 

d. 假设 主机 A 通过 一 条 TCP 连接 向 主机 B 发 送 一 个 大 文件 。 如 果 对 于 这 条 连接 的 一 个 报 文 段 的 序 
号 为 m， 则 对 于 后 继 报 文 段 的 序号 将 必然 是 m+1。 

e. TCP 报 文 段 在 它 的 首部 中 有 一 个 rwnd 字段 。 

f. 假定 在 一 条 TCP 连接 中 最 后 的 SampleRTT 等 于 1 秒 ， 那 么 对 于 该 连接 的 TimeoutInterval 的 当前 值 
必定 大 于 等 于 1 BD. 

g 假设 主机 A 通过 一 条 TCP 连接 向 主机 B 发 送 一 个 序号 为 38 的 4 个 字 节 的 报 文 段 。 在 这 个 相同 的 
报 文 段 中 ， 确 认 号 必定 是 42。 

R15. 假设 主机 A 通过 一 条 TCP 连接 向 主机 B 发 送 两 个 紧 接着 的 TCP 报 文 段 。 第 一 个 报 文 段 的 序号 为 90， 
第 二 个 报 文 段 序号 为 110。 
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a 第 一 个 报 文 段 中 有 多 少数 据 ? 
b 假设 第 一 个 报 文 段 丢失 而 第 二 个 报 文 段 到 达 主 机 B。 那 么 在 主机 B 发 往 主机 A 的 确认 报 文中 ， 
确认 号 应 该 是 多 少 ? 

R16. 考虑 在 3.5 节 中 讨论 的 Telnet 的 例子 。 在 用 户 键入 字符 C 数秒 之 后 ， 用 户 又 键入 字符 R。 那 么 在 用 
户 键入 字符 R 之 后 ， 总 共 发 送 了 多 少 个 报 文 段 ， 这 些 报 文 段 中 的 序号 和 确认 字段 应 该 填 人 什么 ? 

3:7 $ 

R17. 假设 两 条 TCP 连接 存在 于 一 个 带宽 为 R bps 的 瓶颈 链 路 上 。 它 们 都 要 发 送 一 个 很 大 的 文件 〈 以 相同 
方向 经 过 瓶颈 链 路 ) ， 并 且 两 者 是 同时 开始 发 送 文件 。 那 么 TCP 将 为 每 条 连接 分 配 什么 样 的 传输 
速率 ? 

R18. 是 非 判 断 题 。 考 虑 TCP 的 拥塞 控制 。 当 发 送 方 定时 器 超时 时 ， 其 ssthresh 的 值 将 被 设置 为 原来 值 的 
一 半 。 

R19. 在 3.7 节 的 “TCP HA” WEF, HF TCP 分 岔 的 响应 时 间 ， 断 言 大 约 是 4* RIT,, + RTTse + 处理 
时 间 。 评 价 该 断言 。 


习题 


Pl. 假设 客户 A 向 服务 器 S 发 起 一 个 Telnet 会 话 。 与 此 同时 ， 客 户 B 也 向 服务 器 S 发 起 一 个 Telnet 会 话 。 
给 出 下 面 报 文 段 的 源 端口 号 和 目的 端口 号 : 
a. 从 A 向 S 发 送 的 报 文 段 。 
b. 从 B 向 S 发 送 的 报 文 段 。 
c. MS 向 A 发 送 的 报 文 段 。 
d. 从 S 向 B 发 送 的 报 文 段 。 
e. 如 果 A 和 B 是 不 同 的 主机 ， 那 么 从 A 向 $ 发 送 的 报 文 段 的 源 端口 号 是 否 可 能 与 从 B 向 $S 发送 的 报 

文 段 的 源 端口 号 相同 ? 

f 如 果 它 们 是 同一 台 主 机 ， 人 情况 会 怎么 样 ? 

P2. 考虑 图 3-5。 从 服务 器 返回 客户 进程 的 报 文 流 中 的 源 端口 号 和 目的 端口 号 是 多 少 ? 在 承载 运输 层 报 文 
段 的 网 络 层 数据 报 中 ，IP 地 址 是 多 少 ? 

P3. UDP Ail TCP 使 用 反 码 来 计算 它们 的 检验 和 。 假 设 你 有 下 面 3 个 8 比特 字 节 : 01010011, 01100110, 
01110100。 这 些 8 比特 字 节 和 的 反 码 是 多 少 ? (注意 到 尽管 UDP Al TCP 使 用 16 比特 的 字 来 计算 检验 
和 ， 但 对 于 这 个 问题 ， 你 应 该 考虑 8 比特 和 。) 写 出 所 有 工作 过 程 。UDP 为 什么 要 用 该 和 的 反 码 ， 即 
为 什么 不 直接 使 用 该 和 呢 ? 使 用 该 反 码 方案 ， 接 收 方 如 何 检测 出 差错 ? 1 比特 的 差错 将 可 能 检测 不 出 
来 吗 ? 2 比特 的 差错 呢 ? 

P4. a. 假定 你 有 下 列 2 个 字 节 : 01011100 和 01100101。 这 2 个 字 节 之 和 的 反 码 是 什么 ? 
b. 假定 你 有 下 列 2 个 字 节 : 11011010 和 01100101。 这 2 个 字 节 之 和 的 反 码 是 什么 ? 
c 对 于 ta) 中 的 字 节 ， 给 出 一 个 例子 ， 使 得 这 2 个 字 节 中 的 每 一 个 都 在 一 个 比特 反 转 时 ， 其 反 码 不 

会 改变 。 

PS. 假定 某 UDP 接收 方 对 接收 到 的 UDP 报 文 段 计算 因特网 检验 和 ， 并 发 现 它 与 承载 在 检验 和 字段 中 的 值 
相 匹 配 。 该 接收 方 能 够 绝对 确信 没有 出 现 过 比特 差错 吗 ? 试 解 释 之 。 

P6. 考虑 我 们 改正 协议 rdt2. 1 的 动机 。 试 说 明 如 图 3-57 所 示 的 接收 方 与 如 图 3-11 所 示 的 发 送 方 运行 时 ， 
接收 方 可 能 会 引起 发 送 方 和 接收 方 进入 死 锁 状 态 ， 即 双方 都 在 等 待 不 可 能 发 生 的 事件 。 

P7. 在 rdt3.0 协议 中 ， 从 接收 方向 发 送 方 流动 的 ACK 分 组 没有 序号 (尽管 它们 具有 ACK 字段 ， 该 字段 包 
括 了 它们 正在 确认 的 分 组 的 序号 ) 。 为 什么 这 些 ACK 分 组 不 需要 序号 呢 ? 

P8. 画 出 协议 rdt3. 0 中 接收 方 的 FSM, 

PO. 当 数 据 分 组 和 确认 分 组 发 生 算 改 时 ， 给 出 rdB3.0 协议 运行 的 轨迹 。 你 画 的 轨迹 应 当 类 似 于 图 3-16 中 
所 用 的 图 。 

P10. 考虑 一 个 能 够 丢失 分 组 但 其 最 大 时 延 已 知 的 信道 。 修 改 协议 rd2. 1， 以 包括 发 送 方 超时 和 重 传 机 制 。 
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rdt_rcv(rcvpkt) && 等 待 来 自 等 待 来 


非 正 式 地 论证 : 为 什么 你 的 协议 能 够 通过 该 信道 正确 通信 ? 
rdt_rvc (rcvpkt) && notcorrupt (rcvpkt) 
&& has_seq0 (rcvpkt) 


extract (rcvpkt, data) 
deliver_data (data) 

compute chksum 

make_pkt (sendpkt, ACK, chksum) 
udt_send (sndpkt) 


rdt_rcv(revpkt) && 
1 T T (corrupt (rcvpkt) 图 | 
has_seq0 (rcevpkt) ) ) 
compute chksum 
自 make_pkt (sndpkt, NAK, chksum) 


a i dt k 
(corrupt (revpkt) | | 下 层 的 0 下 层 的 1 udt_send(sndpkt) 
has_seql (rcvpkt) ) ) 


compute chksum 
make_pkt (sndpkt, NAK, chksum) 


udt_send(sndpkt) rdt_rvc(rcevpkt) && notcorrupt (rcvpkt) 


PII. 


P12. 


Pts, 


P14. 


PIS: 


P16. 


PIZ. 


&& has_seql (rcvpkt) 


extract (rcvpkt, data) 
deliver_data (data) 

compute chksum 

make_pkt (sendpkt, ACK, chksum) 
udt_send(sndpkt) 


图 3-57 协议 rd2.1 的 一 个 不 正确 的 接收 方 


考虑 在 图 3-14 中 的 rdt2. 2 接收 方 ， 在 状态 “等 待 来 自 下 层 的 0” 和 状态 “等 待 来自 下 层 的 1” 中 的 
自转 换 ( 即 从 某 状态 转换 回 自身 ) 中 生成 一 个 新 分 组 : sndpk =make_ pkt (ACK, 1, checksum) 和 
sndpk = make_ pkt (ACK，0，checksum) 。 如 果 这 个 动作 从 状态 “等 竺 来自 下 层 的 1” 中 的 自转 换 
中 删除 ， 该 协议 将 正确 工作 吗 ? 评估 你 的 答案 。 在 状态 “等 待 来 自 下 层 的 0” 中 的 自转 换 中 删除 这 
个 事件 将 会 怎样 ? [提示 : 在 后 一 种 情况 下 ， 考 虑 如 果 第 一 个 发 送 方 到 接收 方 的 分 组 损坏 的 话 ， 将 
会 发 生 什 么 情况 ?] 

rdt3.0 协议 的 发 送 方 直接 忽略 ( 即 不 采取 任何 动作 ) 接收 到 的 所 有 出 现 差错 和 确认 分 组 的 确认 号 
(acknum) 字段 中 的 值 有 差错 的 分 组 。 假 设 在 这 种 情况 下 ，rdt3. 0 只 是 重 传 当前 的 数据 分 组 ， 该 协 
议 是 否 还 能 正常 运行 ? (提示 : 考虑 在 下 列 情况 下 会 发 生 什 么 情况 : 仅 有 一 个 比特 差错 时 ; 报 文 没 
有 丢失 但 能 出 现 定时 器 过 早 超时 。 考 虑 到 当 n 趋 于 无 穷 时 ， 第 ”个 分 组 将 被 发 送 多 少 次 。) 

考虑 rdt3.0 协议 。 如 果 发 送 方 和 接收 方 的 网 络 连 接 能 够 对 报 文 重 排序 ( 即 在 发 送 方 和 接收 方 之 间 的 
媒体 上 传播 的 两 个 报 文 段 能 重新 排序 ) ， 那 么 比特 交替 协议 将 不 能 正确 工作 (确信 你 清楚 地 理解 这 
时 它 不 能 正确 工作 的 原因 ) ， 试 画图 说 明之 。 画 图 时 把 发 送 方 放 在 左边 ， 接 收 方 放 在 右边 ， 使 时 间 
轴 朝 下 ， 标 出 交换 的 数据 报 文 (D) 和 确认 报 文 (A)。 要 标明 与 任何 数据 和 确认 报 文 段 相关 的 
序号 。 

考虑 一 种 仅 使 用 否定 确认 的 可 靠 数据 传输 协议 。 假 定 发 送 方 只 是 偶尔 发 送 数据 。 只 用 NAK 的 协议 
是 否 会 比 使 用 ACK 的 协议 更 好 ? 为什么? 现在 我 们 假设 发 送 方 要 发 送 大 量 的 数据 ， 并 且 该 端 到 端 
连接 很 少 丢 包 。 在 第 二 种 情况 下 ， 只 用 NAK 的 协议 是 否 会 比 使 用 ACK 的 协议 更 好 ? 为 什么 ? 

考虑 显示 在 图 3-17 中 的 网 络 跨越 国家 的 例子 。 窗 口 长 度 设置 成 多 少时 ， 才 能 使 该 信道 的 利用 率 超过 
90% ? 假设 分 组 的 长 度 为 1500 字 节 (包括 首部 字段 和 数据 ) 。 

假设 某 应 用 使 用 rdB. 0 作为 其 运输 层 协 议 。 因 为 停 等 协议 具有 非常 低 的 信道 利用 率 〈 显 示 在 网 络 跨 
越 国家 的 例子 中 ) ， 该 应 用 程序 的 设计 者 让 接收 方 持续 回 送 许 多 (大 于 2) 交替 的 ACK O Fil ACK 1, 
即使 对 应 的 数据 未 到 达 接 收 方 。 这 个 应 用 程序 设计 将 能 增加 信道 利用 率 吗 ? 为 什么 ? 该 方法 存在 某 
种 潜在 的 问题 吗 ? 试 解 释 之 。 

考虑 两 个 网 络 实体 A 和 B， 它 们 由 一 条 完善 的 双向 信道 所 连接 ( 即 任何 发 送 的 报 文 将 正确 地 收 到 |; 
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信道 将 不 会 损坏 、 丢 失 或 重 排序 分 组 ) 。A 和 B 将 以 交互 的 方式 彼此 交付 报 文 : 首先 ，A 必须 向 B 
交付 一 个 报 文 ，B 然后 必须 向 A 交付 一 个 报 文 ， 接 下 来 A 必须 向 B 交付 一 个 报 文 ， 等 等 。 如 果 一 个 
实体 处 于 它 不 试图 向 男 一 侧 交付 报 文 的 状态 ， 将 存在 一 个 来 自 上 层 的 类 似 于 rdt_send( data) WH H) 
事件 ， 它 试图 向 下 传送 数据 以 向 另 一 侧 传 输 ， 来 自 上 层 的 该 调用 能 够 直接 忽略 对 于 rdt_unable_to_ 
send( data) 调用 ， 这 通知 较 高 层 当 前 不 能 够 发 送 数据 。[ 注意 : 做 出 这 种 简化 的 假设 ， 使 你 不 必 担 心 
缓存 数据 ,] 

对 该 协议 画 出 FSM 说 明 (一 个 FSM HFA, 一 个 FSM 用 于 B) 。 注 意 你 不 必 担 心 这 里 的 可 靠 性 
机 制 ， 该 问题 的 要 点 在 于 创建 反映 这 两 个 实体 的 同步 行为 的 FSM 说 明 。 应 当 使 用 与 图 3-9 中 协议 
rdtl. 0 有 相同 含义 的 下 列 事 件 和 动作 : rdt_send( data), packet = make_pkt( data), udt__send( data) , 
rdt_rev( packet) ，extract( packet ,data) ，deliver_data( data) 。 保 证 你 的 协议 反映 了 A 和 B 之 间 发 送 的 
严格 交替 。 还 要 保证 在 你 的 FSM 描述 中 指出 A 和 B 的 初始 状态 。 

在 3.4.4 节 我 们 学 习 的 一 般 性 SR 协议 中 ， 只 要 报 文 可 用 (如果 报 文 在 窗口 中 ) ， 发 送 方 就 会 不 等 待 
确认 而 传输 报 文 。 假 设 现在 我 们 要 求 一 个 SR 协议 ， 一 次 发 出 一 对 报 文 ， 而 且 只 有 在 知道 第 一 对 报 
文中 的 两 个 报 文 都 正确 到 达 后 才 发 送 第 二 对 报 文 。 

假设 该 信道 中 可 能 会 丢失 报 文 ， 但 报 文 不 会 发 生 损坏 和 失 序 。 试 为 报 文 的 单 向 可 靠 传输 而 设计 
一 个 差错 控制 协议 。 画 出 发 送 方 和 接收 方 的 FSM 描述 。 描 述 在 发 送 方 和 接收 方 之 间 两 个 方向 发 送 的 
报 文 格式 。 如 果 你 使 用 了 不 同 于 3.4 节 (例如 udt_send( ) 、start_timer( ) 、rdt_rev( ) 等 ) 中 的 任何 
其 他 过 程 调用 ， 详 细 地 阐述 这 些 动 作 。 举 例 说 明 (用 发 送 方 和 接收 方 的 时 序 踪迹 图 ) 你 的 协议 是 如 
何 恢复 报 文 丢 失 的 。 
考虑 一 种 情况 ， 主 机 A 想 同时 向 主机 B 和 主机 C 发 送 分 组 。A 与 B 和 C 是 经 过 广播 信道 连接 的 ， 即 
由 A 发 送 的 分 组 通过 该 信道 传送 到 B 和 C。 假设 连接 A、B 和 C 的 这 个 广播 信道 具有 独立 的 报 文 丢 
失 和 损坏 特性 (例如 ， 从 A 发 出 的 报 文 可 能 被 B 正确 接收 ,但 没有 被 C 正确 接收 )。 设 计 一 个 类 似 
于 停 等 协议 的 差错 控制 协议 ， 用 于 从 A 可 靠 地 传输 分 组 到 B 和 C。 该 协议 使 得 A 直到 得 知 B 和 C 已 
经 正确 接收 到 当前 报 文 ， 才 获取 上 层 交付 的 新 数据 。 给 出 A 和 C AY FSM 描述 。( 提 示 : B 的 FSM 大 
体 上 应 当 与 C 的 相同 。) 同时 ,给 出 所 使 用 的 报 文 格式 的 描述 。 
考虑 一 种 主机 A 和 主机 B 要 向 主机 C 发 送 报 文 的 情况 。 主 机 A AC 通过 一 条 报 文 能 够 丢失 和 损坏 
(但 不 重 排序 ) 的 信道 相连 接 。 主 机 B 和 C 由 男 一 条 (与 连接 A 和 C 的 信道 独立 ) 具有 相同 性 质 的 
信道 连接 。 在 主机 C 上 的 运输 层 ， 在 向 上 层 交 付 来 自主 机 A ALB 的 报 文 时 应 当 交 替 进 行 ( 即 它 应 当 
首先 交付 来 自 A 的 分 组 中 的 数据 ， 然 后 是 来 自 B 的 分 组 中 的 数据 ， 等 等 ) 。 设 计 一 个 类 似 于 停 等 协 
议 的 差错 控制 协议 ， 以 可 靠 地 向 C 传输 来 自 A 和 B 的 分 组 ， 同 时 以 前 面 描述 的 方式 在 C 处 交替 地 交 
付 。 给 出 A 和 C 的 FSM 描述。( 提 示 : B 的 FSM 大 体 上 应 当 与 A 的 相同 。) 同时 ， 给 出 所 使 用 的 报 
文 格式 的 描述 。 


. 假定 我 们 有 两 个 网 络 实体 A 和 B。B 有 一 些 数据 报 文 要 通过 下 列 规 则 传 给 A。 当 A 从 其 上 层 得 到 一 


EPR, BUA B 获取 下 一 个 数据 (D) 报 文 。A 必须 通过 A 一 B 信道 向 B 发 送 一 个 请 求 (R) WL 
仅 当 B 收 到 一 个 R 报 文 后 ， 它 才 会 通过 B 一 A 信道 向 A 发 送 一 个 数据 (D) RX. A 应 当 准 确 地 将 
每 份 D 报 文 的 副本 交付 给 上 层 。R 报 文 可 能 会 在 A 一 B 信道 中 丢失 (但 不 会 损坏 ); D 报 文 一 旦 发 
出 总 是 能 够 正确 交付 。 两 个 信道 的 时 延 未 知 且 是 变化 的 。 

设计 一 个 协议 (给 出 FSM 描述 )， 它 能 够 综合 适当 的 机 制 ， 以 补偿 会 丢 包 的 A 一 B 信道 ， 并 且 
实现 在 A 实体 中 向 上 层 传递 报 文 。 只 采用 绝对 必要 的 机 制 。 
考虑 一 个 CBN 协议 ， 其 发 送 方 窗口 为 4， 序 号 范围 为 1024。 假 设 在 时 刻 :， 接 收 方 期 待 的 下 一 个 有 
序 分 组 的 序号 是 上。 假设 媒体 不 会 对 报 文 重新 排序 。 回 答 以 下 问题 : 
a 在 1 时 刻 ， 发 送 方 窗口 内 的 报 文 序号 可 能 是 多 少 ? 论证 你 的 回答 。 
b. 在 上 时 刻 ， 在 当前 传播 回 发 送 方 的 所 有 可 能 报 文中 ，ACK 字段 的 所 有 可 能 值 是 多 少 ? 论证 你 的 

回答 。 

考虑 CBN 协议 和 SR 协议 。 假 设 序号 空间 的 长 度 为 上 k， 那 么 为 了 避免 出 现 图 3-27 中 的 问题 ， 对 于 这 
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两 种 协议 中 的 每 一 种 ， 人 允许 的 发 送 方 窗口 最 大 为 多 少 ? 

对 下 面 的 问题 判断 是 非 ， 并 简要 地 证 实 你 的 回答 : 

a. 对 于 SR 协议 ， 发 送 方 可 能 会 收 到 落 在 其 当前 窗口 之 外 的 分 组 的 ACK, 

b. 对 于 CBN 协议 ， 发 送 方 可 能 会 收 到 落 在 其 当前 窗口 之 外 的 分 组 的 ACK, 

e 当 发 送 方 和 接收 方 窗口 长 度 都 为 1 时 ， 比 特 交 替 协 议 与 SR 协议 相同 。 

d. 当 发 送 方 和 接收 方 窗口 长 度 都 为 1 时 ， 比 特 交 替 协 议 与 CBN 协议 相同 。 

我 们 曾经 说 过 ， 应 用 程序 可 能 选择 UDP 作为 运输 协议 ， 因 为 UDP 提供 了 (ke TCP) 更 好 的 应 用 层 

控制 ， 以 决定 在 报 文 段 中 发 送 什么 数据 和 发 送 时 机 。 

a. 应 用 程序 为 什么 对 在 报 文 段 中 发 送 什么 数据 有 更 多 的 控制 ? 

b. 应 用 程序 为 什么 对 何 时 发 送 报 文 段 有 更 多 的 控制 ? 

考虑 从 主机 A 向 主机 B 传输 LL 字 节 的 大 文件 ,假设 MSS 为 536 字 节 。 

a. 为 了 使 得 TCP 序号 不 至 于 用 完 , 荆 的 最 大 值 是 多 少 ? 前 面 讲 过 TCP 的 序号 字段 为 4 字 节 。 

b. 对 于 你 在 (a) 中 得 到 的 也， 求 出 传输 此 文件 要 用 多 长 时 间 ?” 假定 运输 层 、 网 络 层 和 数据 链 路 层 
首部 总 共 为 66 字 节 ， 并 加 在 每 个 报 文 段 上 ， 然 后 经 155Mbps 链 路 发 送 得 到 的 分 组 。 忽 略 流量 控 
制 和 拥塞 控制 ， 使 主机 A 能 够 一 个 接 一 个 和 连续 不 断 地 发 送 这 些 报 文 段 。 

主机 A 和 B 经 一 条 TCP 连接 通信 ， 并且 主机 B 已 经 收 到 了 来 自 A 的 最 长 为 126 字 节 的 所 有 字 节 。 

假定 主机 A 随后 向 主机 B 发 送 两 个 紧 接 着 的 报 文 段 。 第 一 个 和 第 二 个 报 文 段 分 别 包含 了 80 字 节 和 

40 字 节 的 数据 。 在 第 一 个 报 文 段 中 ， 序 号 是 127， 源 端口 号 是 302， 目 的 地 端口 号 是 80。 无 论 何 时 

主机 B 接收 到 来 自主 机 A 的 报 文 段 ， 它 都 会 发 送 确认 。 

a. 在 从 主机 A AE B 的 第 二 个 报 文 段 中 ,序号 、 源 端口 号 和 目的 端口 号 各 是 什么 ? 

b. 如 果 第 一 个 报 文 段 在 第 二 个 报 文 段 之 前 到 达 ， 在 第 一 个 到 达 报 文 段 的 确认 中 ， 确认 号 、 源 端口 号 
和 目的 端口 号 各 是 什么 ? 

. 如 果 第 二 个 报 文 段 在 第 一 个 报 文 段 之 前 到 达 ， 在 第 一 个 到 达 报 文 段 的 确认 中 ,确认 号 是 什么 ? 

. 假定 由 A 发 送 的 两 个 报 文 段 按 序 到 达 B。 第 一 个 确认 丢失 了 而 第 二 个 确认 在 第 一 个 超时 间隔 之 后 
到 达 。 男 出 时 序 图 ， 显 示 这 些 报 文 段 和 发 送 的 所 有 其 他 报 文 段 和 确认 。 (假设 没有 其 他 分 组 丢 
失 。) 对 于 图 上 每 个 报 文 段 ， 标 出 序号 和 数据 的 字 节 数量 ; 对 于 你 增加 的 每 个 应 答 ， 标 出 确认 号 。 

主机 A 和 B 直接 经 一 条 100Mbps 链 路 连接 。 在 这 两 台 主 机 之 间 有 一 条 TCP 连接 。 主 机 A 经 这 条 连 

接 向 主机 B 发 送 一 个 大 文件 。 主 机 A 能 够 向 它 的 TCP 套 接 字 以 高 达 120Mbps 的 速率 发 送 应 用 数据 ， 

而 主机 B 能 够 以 最 大 50Mbps 的 速率 从 它 的 TCP 接收 缓存 中 读 出 数据 。 描 述 TCP 流量 控制 的 影响 。 

Æ 3.5.6 节 中 讨论 了 SYN cookie, 

a. 服务 器 在 SYNACK 中 使 用 一 个 特殊 的 初始 序号 ， 这 为 什么 是 必要 的 ? 

b. 假定 某 攻 击 者 得 知 了 一 台 目 标 主机 使 用 了 SYN cookie。 该 攻击 者 能 够 通过 直接 向 目标 发 送 一 个 
ACK 分 组 创建 半 开 或 全 开 连 接 吗 ? 为 什么 ? 

c. 假设 某 攻 击 者 收集 了 由 服务 器 发 送 的 大 量 初始 序号 。 该 攻击 者 通过 发 送 具 有 初始 序号 的 ACK， 能 
够 引起 服务 器 产生 许多 全 开 连 接 吗 ? 为 什么 ? 

考虑 在 3. 6. 1 节 中 显示 在 第 二 种 情况 下 的 网 络 。 假 设 发 送 主机 A 和 B 具有 某 些 固定 的 超时 值 。 

a. 证 明 增 加 路 由 器 有 限 缓存 的 长 度 可 能 减 小 吞吐 量 (Aout) 。 

b. 现在 假设 两 台 主 机 基于 路 由 器 的 缓存 时 延 ， 动 态 地 调整 它们 的 超时 值 ( 像 TCP 所 做 的 那样 ) 。 增 
加 缓存 长 度 将 有 助 于 增加 吞吐 量 吗 ? 为 什么 ? 

假设 测量 的 5 个 SampleRTT {È (参见 3.5.3 节 ) 是 106ms、120ms、140ms 90ms 和 115ms。 在 获得 

了 每 个 SampleRTT 值 后 计算 EstimatedRTT ， 使 用 a = 0. 125 并 且 假 设 在 刚 获得 前 SS 个 样本 之 后 Esti- 

matedRTT 的 值 为 100ms。 在 获得 每 个 样本 之 后 ， 也 计算 DevRTT, 假设 8 =0.25， 并 且 假 设 在 刚 获得 

前 5 个 样本 之 后 DevRTT 的 值 为 Sms。 最 后 ， 在 获得 这 些 样本 之 后 计算 TCP TimeoutInterval 。 

考虑 TCP 估计 RTT 的 过 程 。 假 设 a =0.1， 令 SampleRT 设置 为 最 新 样本 RTT, + SampleRT, 设置 为 

下 一 个 最 新 样本 RIT， 等 等 。 
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a 对 于 一 个 给 定 的 TCP 连接 ， 假 定 4 个 确认 报 文 相继 到 达 ， 带 有 4 个 对 应 的 RTT (EL: SampleRTy,, 
SampleRT,, 、SampleRT- 和 SampleRT+ 。 根 据 这 4 个 样本 RTT 表示 EstimatedRTT , 

b. 将 你 得 到 的 公式 一 般 化 到 m 个 RTT 样本 的 情况 。 

c 对 于 在 (b) 中 得 到 的 公式 , 令 n 趋 于 无 穷 。 试 说 明 为 什么 这 个 平均 过 程 被 称 为 指数 移动 平均 。 


. 在 3.5.3 节 中 , 我们 讨论 了 TCP 的 往返 时 间 的 估计 。TCP 避免 测量 重 传 报 文 段 的 SampleRTT， 对 此 


你 有 何 看 法 ? 


. 3.5.4 节 中 的 变量 SendBase 和 3. 5.5 节 中 的 变量 LastByteRcvd 之 间 有 什么 关系 ? 
, 3.5.5 节 中 的 变量 LastByteRevd 和 3. 5.4 节 中 的 变量 y 之 间 有 什么 关系 ? 
. 在 3.5.4 节 中 ， 我们 看 到 TCP 直到 收 到 3 个 元 余 ACK 才 执 行 快速 重 传 。 你 对 TCP 设计 者 没有 选择 


在 收 到 对 报 文 段 的 第 一 个 元 余 ACK 后 就 快速 重 传 有 何 看 法 ? 


. 比较 GBN、SR 和 TCP (无 延 时 的 ACK). 假设 对 所 有 3 个 协议 的 超时 值 足 够 长 ， 使 得 5 个 连续 的 数 


据 报 文 段 及 其 对 应 的 ACK 能 够 分 别 由 接收 主机 (主机 B) 和 发 送 主机 (EHA) KA (MRE 
道中 无 丢失 ) 。 假 设 主机 A 向 主机 B 发 送 5 个 数据 报 文 段 ， 并 且 第 二 个 报 文 段 (MA 发 送 ) ER. 
最 后 ， 所 有 5 个 数据 报 文 段 已 经 被 主机 B 正确 接收 。 
a. 主机 A 总 共 发 送 了 多 少 报 文 段 和 主机 B 总 共 发 送 了 多 少 ACK? 它们 的 序号 是 什么 ? 对 所 有 3 个 
协议 回答 这 个 问题 。 
b. 如 果 对 所 有 3 个 协议 超时 值 比 5RTT 长 得 多 ， 则 哪个 协议 在 最 短 的 时 间 间 隔 中 成 功 地 交付 所 有 5 
个 数据 报 文 段 ? 
在 图 3-52 中 的 TCP Hi, BA ssthresh 的 值 在 几 个 地 方 被 设置 为 ssthresh = cwnd/2， 并 且 当 出 现 
一 个 丢 包 事件 时 ，ssthresh 的 值 被 设置 为 窗口 长 度 的 一 半 。 当 出 现 丢 包 事件 时 ， 发 送 方 发 送 的 速率 ， 
每 个 RIT 必须 大 约 等 于 cwnd 报 文 段 吗 ? 解释 你 的 答案 。 如 果 你 的 回答 是 没有 ， 你 能 建议 一 种 不 同 
的 方式 ， 进 行 ssthresh 设置 吗 ? 
考虑 图 3-46b。 如 果 ?增加 超过 了 R/2，A 和 ,能 够 增加 超过 R/3 吗 ? 试 解释 之 。 现 在 考虑 图 3-46c。 
假定 一 个 分 组 从 路 由 器 到 接收 方 平均 转发 两 45 
次 的 话 ， 如 果 和 Ai 增加 超过 RA2，A 和 ,能 够 增加 40 a 
超过 R/4 吗 ?7 试 解释 之 。 R 35 
考虑 图 3-58。 假 设 TCP Reno 是 一 个 经 历 如 上 HR 3 
所 示 行 为 的 协议 ， 回 答 下 列 问题 。 ee S| | 1 一 
况 中 ， 简 要 地 论证 你 的 回答 。 -PA D rs 
a. 指出 TCP 慢 启动 运行 时 的 时 间 间 隔 。 P e ee 
b. 指出 TCP 拥塞 避免 运行 时 的 时 间 间 隔 。 
. 在 第 16 个 传输 轮回 之 后 ， 报 文 段 的 丢失 是 F” 
根据 3 个 元 余 ACK 还 是 根据 超时 检测 出 Ws Lae 
0 2 4 6 8 10 12 14 16 18 20 22 24 26 


来 的 ? . 
. 在 第 22 个 传输 轮回 之 后 ， 报 文 段 的 丢失 是 传输 轮回 
来 的 ? 图 3-58 TCP 窗口 长 度 作 为 时 间 的 函数 


根据 3 个 元 余 ACK 还 是 根据 超时 检测 出 

在 第 1 个 传输 轮回 里 ，ssthresh 的 初始 值 设置 为 多 少 ? 

在 第 18 个 传输 轮回 里 ，ssthresh 的 值 设 置 为 多 少 ? 

在 第 24 个 传输 轮回 里 ，ssthresh 的 值 设 置 为 多 少 ? 

在 哪个 传输 轮回 内 发 送 第 70 个 报 文 段 ? 

假定 在 第 26 个 传输 轮回 后 ， 通 过 收 到 3 个 元 余 ACK 检测 出 有 分 组 丢失 ， 拥 塞 的 窗口 长 度 和 
ssthresh 的 值 应 当 是 多 少 ? 


. 假定 使 用 TCP Tahoe (而 不 是 TCP Reno) ， 并 假定 在 第 16 个 传输 轮回 收 到 3 个 宛 余 ACK。 在 第 19 
个 传输 轮回 ，ssthresh 和 拥塞 窗口 长 度 是 什么 ? 
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k. 再 次 假设 使 用 TCP Tahoe, #8 22 个 传输 轮回 有 一 个 超时 事件 。 从 第 17 个 传输 轮回 到 第 22 个 传 
输 轮 回 〈 包 括 这 两 个 传输 轮回 ) ， 一 共 发 送 了 多 少 分 组 ” 

参考 图 3-55 ， 该 图 描述 了 TCP 的 AIMD 算法 的 收敛 特性 。 假 设 TCP 不 采用 乘 性 减 ， 而 是 采用 按 某 一 

常量 减 小 窗口 。 所 得 的 AIAD 算法 将 收敛 于 一 种 平等 共享 算法 吗 ? 使 用 类 似 于 图 3-55 中 的 图 来 证 实 

你 的 结论 。 

在 3.5.4 节 中 ， 我们 讨论 了 在 发 生 超时 事件 后 将 超时 间隔 加 倍 。 为 什么 除了 这 种 加 倍 超时 间隔 机 制 

外 ，TCP 还 需要 基于 窗口 的 拥塞 控制 机 制 (如 在 3.7 节 中 学 习 的 那 种 机 制 ) 呢 ? 

主机 A 通过 一 条 TCP 连接 向 主机 B 发送 一 个 很 大 的 文件 。 在 这 条 连接 上 ， 不 会 出 现任 何 分 组 丢失 和 

定时 器 超时 。 主 机 A 与 因特网 连接 链 路 的 传输 速率 表示 为 R bps。 假 设 主机 A 上 的 进程 能 够 以 S bps 

的 速率 向 TCP 套 接 字 发 送 数 据 ， 其 中 5 = 10 xR。 进 一 步 假 设 TCP 的 接收 缓存 足够 大 ， 能 够 容纳 整 

个 文件 ， 并 且 发 送 缓存 只 能 容纳 这 个 文件 的 百 分 之 一 。 如 何 防止 主机 A 上 的 进程 连续 地 向 TCP 套 接 

字 以 速率 S bps 传送 数据 呢 ?” 还 是 用 TCP 流量 控制 呢 ? 还 是 用 TCP 拥塞 控制 ?或 者 用 其 他 措施 7 前 

述 其 理由 。 

考虑 从 一 台 主 机 经 一 条 没有 丢 包 的 TCP 连接 向 另 一 台 主 机 发 送 一 个 大 文件 。 

a. 假定 TCP 使 用 不 具有 慢 启 动 的 AIMD 进行 拥塞 控制 。 假 设 每 当 收 到 一 批 ACK 时 ，cwnd 增加 1 个 
MSS， 并 且 假 设 往返 时 间 大 约 恒定 ，cwnd 从 6MSS 增加 到 12MSS 要 花费 多 长 时 间 (HARA EW 
事件 )? 

b. 对 于 该 连接 ， 到 时 间 =6RTT， 其 平均 吞吐 量 是 多 少 (根据 MSS Al RTT)? 

回想 TCP 吞吐 量 的 宏观 描述 。 在 连接 速率 从 W/(2 x RIT) 变化 到 W/RTT 的 周期 内 ， 只 丢失 了 一 个 

分 组 (在 该 周期 的 结束 )。 

a. 证 明 其 丢 包 率 (分 组 丢失 的 比率 ) 等 于 : 


b. 如 果 一 条 连接 的 丢 包 率 为 L， 使 用 上 面 的 结果 ， 则 它 的 平均 速率 近似 由 下 式 给 出 : 
; 1. 22 * MSS 

平均 速率 = mr 
考虑 仅 有 一 条 单一 的 TCP (Reno) 连接 使 用 一 条 10Mbps 链 路 ， 且 该 链 路 没有 缓存 任何 数据 。 假 设 
这 条 链 路 是 发 送 主机 和 接收 主机 之 间 的 唯一 拥塞 链 路 。 假 定 某 TCP 发 送 方 向 接收 方 有 一 个 大 文件 要 
发 送 ， 而 接收 方 的 接收 缓存 比 拥塞 窗口 要 大 得 多 。 我 们 也 做 下 列 假设 : 每 个 TCP 报 文 段 长 度 为 1500 
字 节 ; 该 连接 的 双向 传播 时 延 是 150ms; 并 且 该 TCP 连接 总 是 处 于 拥塞 避免 阶段 ， 即 忽略 了 慢 
启动 。 
a. 这 条 TCP 连接 能 够 取得 的 最 大 窗口 长 度 (以 报 文 段 计 ) 是 多 少 ? 
b. 这 条 TCP 连接 的 平均 窗口 长 度 (以 报 文 段 计 ) 和 平均 吞吐 量 (以 bps 计 ) 是 多 少 ? 
c. 这 条 TO 连接 在 从 丢 包 恢 复 后 ， 再 次 到 达 其 最 大 窗口 要 经 历 多 长 时 间 ? 
考虑 在 前 面 习题 中 所 描述 的 场景 。 假 设 10Mbps 链 路 能 够 缓存 有 限 个 报 文 段 。 试 论证 为 了 使 该 链 路 
总 是 忙于 发 送 数据 ， 我 们 将 要 选择 缓存 长 度 ， 使 得 其 至 少 为 发 送 方 和 接收 方 之 间 链 路 速率 C 与 双向 
传播 时 延 之 积 。 
重复 习题 46, 但 用 一 条 10Gbps 链 路 代替 10Mbps 链 路 。 注 意 到 在 对 c 部 分 的 答案 中 ， 应当 认 识 到 在 
从 丢 包 恢复 后 ， 拥 塞 窗口 长 度 到 达 最 大 窗口 长 度 将 需要 很 长 时 间 。 给 出 解决 该 问题 的 基本 思路 。 
AT (用 RTT 度量) 表示 一 条 TCP 连接 将 拥塞 窗口 从 W/2 增加 到 W 所 需 的 时 间 间 隔 ， 其 中 不 是 最 
大 的 拥塞 窗口 长 度 。 论 证 了 是 TCP 平均 吞吐 量 的 晒 数 。 
考虑 一 种 简化 的 TCP 的 AIMD 算法 ， 其 中 拥塞 窗口 长 度 用 报 文 段 的 数量 来 度量 ， 而 不 是 用 字 节 度 
量 。 在 加 性 增 中 ， 每 个 RTT 拥塞 窗口 长 度 增加 一 个 报 文 段 。 在 乘 性 减 中 ， 拥 塞 窗 口 长 度 减 小 一 半 
(如 果 结 果 不 是 一 个 整数 ， 向 下 取 整 到 最 近 的 整数 ) 。 假 设 两 条 TCP 连接 Cl 和 C2， 它们 共享 一 条 速 
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率 为 每 秒 30 个 报 文 段 的 单一 拥塞 链 路 。 假 设 Cl 和 C2 均 处 于 拥塞 避免 阶段 。 连 接 Cl 的 RIT 是 
50ms， 连 接 C2 的 RTT 是 100ms。 假 设 当 链 路 中 的 数据 速率 超过 了 链 路 的 速率 时 ， 所 有 TCP 连接 经 
受 数据 报 文 段 丢 失 。 

a. 如 果 在 时 刻 to, C1 和 C2 具有 10 个 报 文 段 的 拥塞 窗口 ， 在 1000ms 后 它们 的 拥塞 窗口 为 多 长 ? 

b. 经 长 时 间 运 行 ， 这 两 条 连接 将 取得 共享 该 拥塞 链 路 的 相同 的 带宽 吗 ? 

考虑 在 前 面 习题 中 描述 的 网 络 。 现 在 假设 两 条 TCP 连接 Cl 和 C2， 它 们 具有 相同 的 100ms RTT。 假 

设 在 时 刻 ty, Cl 的 拥塞 窗口 长 度 为 15 个 报 文 段 ， 而 C2 的 拥塞 窗口 长 度 是 10 个 报 文 段 。 

a. 在 2200ms 后 ,它们 的 拥塞 窗口 长 度 为 多 长 ? 

b. 经 长 时 间 运 行 ， 这 两 条 连接 将 取得 共享 该 拥塞 链 路 的 相同 的 带宽 吗 ? 

c 如 果 这 两 条 连接 在 相同 时 间 达 到 它们 的 最 大 窗口 长 度 ， 并 在 相同 时 间 达 到 它们 的 最 小 窗口 长 度 ， 
我 们 说 这 两 条 连接 是 同步 的 。 经 长 时 间 运 行 ， 这 两 条 连接 将 最 终 变 得 同步 吗 ? 如 果 是 ， 它 们 的 最 
大 窗口 长 度 是 多 少 ? 

d 这 种 同步 将 有 助 于 改善 共享 链 路 的 利用 率 吗 ? 为 什么 ? 给 出 打破 这 种 同步 的 某 种 思路 。 

考虑 修改 TCP 的 拥塞 控制 算法 。 不 使 用 加 性 增 , 使 用 乘 性 增 。 无 论 何 时 某 TCP 收 到 一 个 合法 的 

ACK， 就 将 其 窗口 长 度 增加 一 个 小 正 数 a (0<a<1) 。 求 出 丢 包 率 工 和 最 大 拥塞 窗口 WW 之 间 的 少数 

关系 。 论 证: 对 于 这 种 修正 的 TCP， 无 论 TCP 的 平均 吞吐 量 如 何 ， 一 条 TCP 连接 将 其 拥塞 窗口 长 度 

从 W/2 增加 到 下 ， 总 是 需要 相同 的 时 间 。 

在 3.7 节 对 TCP 未 来 的 讨论 中 ,我们 注意 到 为 了 取得 10Gbps 的 吞吐 量 ，TCP 仅 能 容忍 2x10 AFR 

文 段 丢 失 率 (或 等 价 为 每 5000 000 000 个 报 文 段 有 一 个 丢 包 事件 ) 。 给 出 针对 3.7 节 中 给 定 的 RIT 

和 MSS 值 的 对 2 x 10-" 值 的 推导 。 如 果 TCP 需要 支持 一 条 100Gbps 的 连接 ， 所 能 容忍 的 丢 包 率 

是 多 少 ? 

在 3.7 节 中 对 TCP 拥塞 控制 的 讨论 中 ， 我 们 隐 含 地 假定 TCP 发 送 方 总 是 有 数据 要 发 送 。 现 在 考虑 下 

列 情况 ， 某 TCP 发送 方 发 送 大 量 数据 ， 然 后 在 n 时 刻 变 得 空闲 〈 因 为 它 没有 更 多 的 数据 要 发 送 ) 。 

TCP 在 相对 长 的 时 间 内 保持 空闲 ， 然 后 在 六 时 刻 要 发 送 更 多 的 数据 。 当 TCP Et, 开始 发 送 数据 时 ， 

让 它 使 用 在 局 时 刻 的 cwnd 和 ssthresh 值 ， 将 有 什么 样 的 优点 和 缺点 ? 你 建议 使 用 什么 样 的 方法 ? 为 

什么 ? 

在 这 个 习题 中 我 们 研究 是 否 UDP 或 TCP 提供 了 某 种 程度 的 端点 鉴别 。 

a. 考虑 一 台 服 务 器 接收 到 在 一 个 UDP 分 组 中 的 请 求 并 对 该 请 求 进行 响应 (例如 ， 如 由 DNS 服务 器 
所 做 的 那样 ) 。 如 果 一 个 具有 四 地址 X 的 客户 用 地 址 Y 进行 哄骗 的 话 ， 服 务 器 将 向 何 处 发 送 它 
的 啊 应 ? 

b. 假定 一 台 服 务 器 接收 到 具有 IP 源 地 址 Y 的 一 个 SYN， 在 用 SYNACK 响应 之 后 ， 接 收 一 个 具有 IP 
源 地 址 Y 和 正确 确认 号 的 ACK, 假设 该 服务 器 选择 了 一 个 随机 初始 序号 并 且 没 有 有 “中间人”， 该 
服务 器 能 够 确定 该 客户 的 确 位 于 Y E? (并 且 不 在 某 个 其 他 哄骗 为 Y 的 地 址 X。) 

在 这 个 习题 中 ， 我 们 考虑 由 TCP 慢 启 动 阶段 引入 的 时 延 。 考 虑 一 个 客户 和 一 个 Web 服务 器 直接 连 

接 到 速率 R 的 一 条 链 路 。 假 定 该 客户 要 取 回 一 个 对 象 ， 其 长 度 正好 等 于 15S$5， 其 中 5 是 最 大 段 长 度 

( MSS) 。 客 户 和 服务 器 之 间 的 往返 时 间 表 示 为 RTT (假设 为 常数 ) 。 忽 略 协议 首部 ， 确 定 在 下 列 情 

况 下 取 回 该 对 象 的 时 间 (包括 TCP 连接 创建 ) : 

a. 4S/R > S/R + RTT >2S/R 

b. S/R + RTT >4S/R 

c. S/R > RTT 


K 编程 作业 


实现 一 个 可 靠 运输 协议 
在 这 个 编程 作业 实验 中 ， 你 将 要 编写 发 送 和 接收 运输 层 的 代码 ， 以 实现 一 个 简单 的 可 靠 数 据 运输 协 
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议 。 这 个 实验 有 两 个 版 本 ， 即 比特 交替 协议 版 本 和 CBN 版 本 。 这 个 实验 应 当 是 有 趣 的 ， 因 为 你 的 实现 将 
与 实际 情况 下 所 要 求 的 差异 很 小 。 

因为 可 能 没有 你 能 够 修改 其 操作 系统 的 独立 机 器 ， 你 的 代码 将 不 得 不 在 模拟 的 硬件 /软件 环境 中 执行 。 
然而 ， 为 你 提供 例 程 的 编程 接口 〈 即 从 上 层 和 下 层 调用 你 的 实体 的 代码 ) ， 非 常 类 似 于 在 实际 UNIX 环境 中 
做 那些 事情 的 接口 。 (实际 上 ,在 本 编程 作业 中 描述 的 软件 接口 比 起 许多 教科 书 中 描述 的 无 限 循环 的 发 送 
方 和 接收 方 要 真实 得 多 。) 停止 和 启动 定时 器 也 是 模拟 的 ， 定 时 器 中 断 将 激活 你 的 定时 器 处 理 例 程 。 

这 个 完整 的 实验 作业 以 及 你 所 需要 的 代码 ， 可 从 本 书 的 Web 网 站 上 获得 : http://www. pearsonhigh- 


ered. com/ cs- resources。 


i Wireshark 实验 : 探究 TCP 


在 这 个 实验 中 ， 你 将 使 用 Web 浏览 器 访问 来 自 某 Web 服务 器 的 一 个 文件 。 如 同 在 前 面 的 Wireshark 
实验 中 一 样 ， 你 将 使 用 Wireshark 来 俘获 到 达 你 计算 机 的 分 组 。 与 前 面 实验 不 同 的 是 ， 你 也 能 够 从 该 Web 
服务 器 下 载 一 个 Wireshark 可 读 的 分 组 踪迹 ， 记载 你 从 服务 器 下 载 文 件 的 过 程 。 在 这 个 服务 器 踪迹 文件 
里 ,你 将 发 现 自己 访问 该 Web 服务 器 所 产生 的 分 组 。 你 将 分 析 客 户 端 和 服务 器 端 踪迹 文件 ， 以 探究 TCP 
的 方方面面 。 特 别 是 你 将 评估 在 你 的 计算 机 与 该 Web 服务 器 之 间 TCP 连接 的 性 能 。 你 将 跟踪 TCP 窗口 行 
为 、 推 断 分 组 丢失 、 重 传 、 流 控 和 拥塞 控制 行为 并 估计 往返 时 间 。 

与 所 有 的 Wireshark 实验 一 样 ， 该 实验 的 全 面 描述 能 够 在 本 书 Web 站 点 http://www. pearsonhighered. 
com/ cs-resources 上 找到 。 


i Wireshark 实验 : 探究 UDP 


在 这 个 简短 实验 中 ， 你 将 进行 分 组 俘获 并 分 析 那 些 使 用 UDP 的 你 喜爱 的 应 用 程序 (例如 ，DNS 或 如 
Skype 这 样 的 多 媒体 应 用 ) 。 如 我 们 在 3.3 节 中 所 学 的 那样 ，UDP 是 一 种 简单 的 、 不 提供 不 必要 服务 的 运 
输 协 议 。 在 这 个 实验 中 ， 你 将 研究 在 UDP 报 文 段 中 的 各 首部 字段 以 及 检验 和 计算 。 

与 所 有 的 Wireshark 实验 一 样 ， 该 实验 的 全 面 描述 能 够 在 本 书 Web 站 点 http://www. pearsonhigh- 
ered. com/cs- resources 上 找到 。 


MM 人物 专 访 


Van Jacobson 就 职 于 谷歌 公司 ， 以 前 是 PARC 的 高 级 研究 员 。 在 此 之 前 ， 
他 是 分 组 设计 (Packet Design) 组 织 的 共同 创建 者 和 首席 科学 家 。 再 往 前 ， 他 
是 思科 公司 的 首席 科学 家 。 在 加 入 思科 之 前 ， 他 是 劳 伦 兹 伯克利 国家 实验 室 
的 网 络 研究 组 的 负责 人 ， 并 在 加 州 大 学 伯克利 分 校 和 斯 坦 福 大 学 任教 。Van 于 
2001 年 因 其 在 通信 网 络 领 域 的 贡献 而 获得 ACM SIGCOMM 终身 成 就 奖 ， 于 
2002 年 因 其 “对 网 络 拥 塞 的 理解 和 成 功 研 制 用 于 因特网 的 拥塞 控制 机 制 ” 而 
获得 TEEE Kobayashi 奖 。 他 于 2004 年 当选 为 美国 国家 工程 院 院 士 。 





。 请 描述 您 职业 生涯 中 做 过 的 一 两 个 最 令 人 激动 的 项 目 。 最 大 的 挑战 是 Vink Jacobian 

什么 ? 

学 校 教会 我 们 许多 寻找 答案 的 方式 。 在 每 个 我 致力 于 的 感 兴 趣 的 问题 中 ， 艰 巨 的 任务 是 找到 正确 的 
问题 。 当 Mike Karels 和 我 开始 关注 TCP 拥塞 时 ， 我 们 花费 数 月 凝视 协议 和 分 组 踪迹 ， 询 问 “ 为 什么 它 会 
失效 ?”。 有 一 天 在 Mike 的 办 公 室 ， 我 们 中 的 一 个 说 : “我 无 法 弄 明 白 它 失效 的 原因 是 因为 我 不 理解 它 究 
竟 如 何 开 始 运转 的 。” 这 导致 提出 了 一 个 正确 问题 ， 它 迫使 我 们 和 弄 明白 使 TCP 运转 的 “ack 计时 ”。 从 那 
以 后 ， 其 他 东西 就 容易 了 。 

© 从 更 为 一 般 的 意义 上 讲 ， 您 认为 网 络 和 因特网 未 来 将 往 何 处 发 展 ? 

对 于 大 多 数 人 来 说 ，Web 是 因特网 。 对 此 ， 网 络 奇才 们 将 会 善意 地 窃 笑 ， 因 为 我 们 知道 Web 是 一 个 


(Ni 
3 
A 


197 


运行 在 因特网 上 的 应 用 程序 ， 但 要 是 以 上 说 法 正确 又 该 如 何 呢 ? 因特网 使 得 主机 对 之 间 能 够 进行 交谈 。 
Web 用 于 分 布 信息 的 生产 和 消耗 。“ 信 息 传播 ”是 一 种 非常 一 般 意义 上 的 通信 ， 而 “成 对 交谈 ”只 是 其 
中 一 个 极 小 的 子 集 。 我 们 需要 向 更 大 的 范围 进发 。 今 天 的 网 络 以 点 到 点 连 线 的 方式 处 理 广播 媒体 (无 线 
电 、PON 等 ) 。 那 是 极为 低 效 的 。 经 过 指头 殴 击 或 智能 手机 ， 遍 及 全 世界 的 每 秒 兆 兆 (107) 比特 的 数据 
正在 交换 ， 但 我 们 不 知道 如 何 将 其 作为 “网 络 ” 处 理 。ISP 正在 忙于 建立 缓存 和 CDN， 以 可 扩展 地 分 发 
视频 和 音频 。 缓 存 是 该 解决 方案 的 必要 部 分 ,但 今天 的 网 络 缺 乏 这 个 部 分 。 从 信息 论 、 排 队 论 或 流量 理 
论 直到 因特网 协议 规范 ， 都 告诉 我 们 如 何 建造 和 部 署 它 。 我 认为 并 希望 在 未 来 几 年 中 ,网络 将 演化 为 包 
含 多 得 多 的 通信 愿景， 支撑 Web 的 运行 。 

。 是 谁 激发 了 您 的 职业 灵感 ? 

当 我 还 在 人 研究生 院 时 ，Richard Feynman 访问 了 学 校 并 做 了 学 术 报 告 。 他 讲 到 了 一 些 量子 理论 知识 ， 
使 我 整 学 期 都 在 努力 理解 该 理论 ， 他 的 解释 非常 简单 和 明白 易 懂 ， 使 得 那些 对 我 而 言 难以 理解 的 东西 变 
得 显而易见 和 不 可 人 避免。 领会 和 表达 复杂 世界 背后 的 简单 性 的 能 力 是 给 我 的 罕见 和 绝妙 的 礼物 。 

© 您 对 进入 计算 机 科学 和 网 络 领域 的 学 生 有 什么 忠告 吗 ? 

网 络 是 奇妙 的 领域 ， 计 算 机 和 网 络 对 社会 的 影响 ， 也 许 比 自 有 文字 记载 以 来 的 任何 发 明 都 大 。 网 络 
本 质 上 是 有 关连 接 的 东西 ， 研 究 它 有 助 于 你 进行 智能 连接 : 蚁 群 搜索 和 蜜蜂 舞蹈 显示 了 协议 设计 好 于 
RFC， 流 量 拥挤 或 人 们 离开 挤 满 人 的 体育 馆 是 拥塞 的 要 素 ， 在 感恩 节 暴 风 雪 后 寻找 航班 返回 学 校 的 学 生 
们 是 动态 路 由 选择 的 核心 。 如 果 你 对 许多 东西 感 兴趣 ， 并 且 要 对 此 干 点 事 ， 很 难 想象 还 有 什么 比 网 络 更 
好 的 领域 了 。 
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网 络 层 : 数据 平面 





在 前 一 章 中 我 们 学 习 了 运输 层 依赖 于 网 络 层 的 主机 到 主机 的 通信 服务 ， 提 供 各 种 形式 
的 进程 到 进程 的 通信 。 我 们 也 学 习 了 运输 层 工 作 时 不 具备 任何 有 关 网 络 层 实 际 实现 这 种 服 
务 的 知识 。 因 此 也 许 你 现在 想 知道 ， 这 种 主机 到 主机 通信 服务 的 真实 情况 是 什么 ? 是 什么 
使 得 它 工作 起 来 的 呢 ? 

在 本 章 和 下 一 章 中 ， 我 们 将 学 习 网 络 层 实际 是 怎样 实现 主机 到 主机 的 通信 服务 的 。 我 
们 将 看 到 与 运输 层 和 应 用 层 不 同 的 是 ， 在 网 络 中 的 每 一 台 主 机 和 路 由 器 中 都 有 一 个 网 络 层 
部 分 。 正 因 如 此 ， 网 络 层 协议 是 协议 栈 中 最 具 挑 战 性 (因而 也 是 最 有 趣 ) 的 部 分 。 

网 络 层 在 协议 栈 中 姐 庸 置疑 是 最 复杂 的 层次 ， 因 此 我 们 将 在 这 里 用 大 量 篇 幅 来 讨论 。 
的 确 因为 涉及 的 内 容 太 多 ， 我 们 要 用 两 章 的 篇 幅 来 讨论 网 络 层 。 我 们 将 看 到 网 络 层 能 够 被 
分 解 为 两 个 相互 作用 的 部 分 ， 即 数据 平面 和 控制 平面 。 在 第 4 章 ， 我们 将 首先 学 习 网 络 层 
的 数据 平面 功能 ， 即 网 络 层 中 每 台 路 由 器 的 功能 ， 该 数据 平面 功能 决定 到 达 路 由 需 输 入 链 
路 之 一 的 数据 报 〈 即 网 络 层 的 分 组 ) 如 何 转发 到 该 路 由 器 的 输出 链 路 之 一 。 我 们 将 涉及 传 
统 的 IP 转发 (其 中 转发 基于 数据 报 的 目的 地 址 ) 和 通用 的 转发 (其 中 可 以 使 用 数据 报 首 
部 中 的 几 个 不 同 域 的 值 执 行 转发 和 其 他 功能 ) 。 我 们 将 详细 地 学 习 IPv4 和 IPv6 协议 及 其 寻 
址 。 在 第 5 章 ， 我 们 将 涉及 网 络 层 的 控制 平面 功能 ， 即 网 络 范围 的 逻辑 ， 该 控制 平面 功能 
控制 数据 报 沿 着 从 源 主 机 到 目的 主机 的 端 到 端 路 径 中 路 由 器 之 间 的 路 由 方式 。 我 们 将 学 习 
路 由 选择 算法 ， 以 及 广泛 用 于 今天 因特网 中 的 诸如 OSPF 和 BGP 等 路 由 选择 协议 。 传 统 
上 ， 这 些 控制 平面 路 由 选择 协议 和 数据 平面 转发 功能 已 被 实现 成 一 个 整体 ， 位 于 一 台 路 由 
器 中 。 软 件 定 义 网 络 ( Software- Defined Networking, SDN) 通过 将 这 些 控制 平面 功能 作为 
一 种 单独 服务 ， 明 确 地 分 离 数 据 平 面 和 控制 平面 ， 控 制 平面 功能 通常 置 于 一 台 远 程 “ 控 制 
at” Po FAVES 5 草 涉 及 SDN 控制 项。 

网 络 层 中 数据 平面 和 控制 平面 之 间 的 功能 区 别 很 重要 ， 当 你 学 习 网 络 层 时 ， 心 中 要 
记 住 这 个 区 别 。 它 将 有 助 于 你 构思 网 络 屋 ， 并且 反映 计算 机 网 络 中 网 络 层 角色 的 现代 
观点 。 


4.1 网 络 层 概述 


图 4-1 显示 了 一 个 简单 网 络 ， 其 中 有 Hl 和 H2 两 台 主 机 ,在 Hl 与 H2 之 间 的 路 径 上 
有 几 台 路 由 器 。 假 设 Hl 正在 向 H2 发 送信 息 ， 考 虑 这 些 主机 与 中 间 路 由 融 的 网 络 层 所 起 
的 作用 。H1 中 的 网 络 层 取得 来 自 于 Hl 运输 层 的 报 文 段 ， 将 每 个 报 文 段 封装 成 一 个 数据 
报 ， 然 后 向 相 邻 路 由 器 R1 发 送 该 数据 报 。 在 接收 方 主机 H2 ， 网 络 层 接收 来 自 相 邻 路 由 天 
R2 的 数据 报 ， 提 取出 运输 层 报 文 段 ， 并 将 其 向 上 交付 给 H2 的 运输 层 。 每 台 路 由 需 的 数据 
平面 的 主要 作用 是 从 其 输入 链 路 向 其 输出 链 路 转发 数据 报 ; 控制 平面 的 主要 作用 是 协调 这 
些 本 地 的 每 路 由 器 转发 动作 ， 使 得 数据 报 沿 着 源 和 目的 地 主机 之 间 的 路 由 堪 路 径 最 终 进 行 
端 到 端 传送 。 注 意 到 图 4-1 中 所 示 路 由 器 具有 截断 的 协议 栈 ， 即 没有 网 络 层 以 上 的 部 分 ， 


ABE: KEFE 199 


因为 路 由 器 不 运行 我 们 已 在 第 2、3 章 学 习 过 的 应 用 层 和 运输 层 协议 。 





图 4-1 网 络 层 


4.1.1 转发 和 路 由 选择 : 数据 平面 和 控制 平面 


网 络 层 的 作用 从 表面 上 看 极为 简单 ， 即 将 分 组 从 一 台 发 送 主机 移动 到 一 台 接 收 主机 。 
为 此 ， 需 要 使 用 两 种 重要 的 网 络 层 功能 : 

。 转发 。 当 一 个 分 组 到 达 某 路 由 器 的 一 条 输入 链 路 时 ， 该 路 由 器 必须 将 该 分 组 移动 
到 适当 的 输出 链 路 。 例 如 ， 在 图 4-1 中 来 自主 机 Hl 到 路 由 器 RI 的 一 个 分 组 ， 必 
须 向 到 达 H2 的 路 径 上 的 下 一 台 路 由 器 转发 。 如 我 们 将 看 到 的 那样 ， 转 发 是 在 数据 
平面 中 实现 的 唯一 功能 (尽管 是 最 为 常见 和 重要 的 功能 )。 在 最 为 常见 的 场合 
(我 们 将 在 4. 4 节 中 讨论 ) ， 分 组 也 可 能 被 现 有 的 路 由 顺 阻 挡 《〈 例 如 ， 该 分 组 来 源 
于 一 个 已 知 的 恶意 主机 ， 或 者 该 分 组 发 向 一 个 被 禁止 的 目的 主机 ) ,或 者 可 能 是 元 
余 的 并 经 过 多 条 出 链 路 发 送 。 
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© 路 由 选择 。 当 分 组 从 发 送 方 流 回 接收 方 时 ， 网 络 层 必须 决定 这 些 分 组 所 采用 的 路 
由 或 路 径 。 计 算 这 些 路 径 的 算法 被 称 为 路 由 选择 算法 (routing algorithm), 。 例 如 ， 
在 图 4-1 中 一 个 路 由 选择 算法 将 决定 分 组 从 Hl 到 H2 流动 所 遵循 的 路 径 。 路 由 选 
择 在 网 络 层 的 控制 平面 中 实现 。 
在 讨论 网 络 层 时 ， 许 多 作者 经 常 交 蔡 使 用 转发 和 路 由 选择 这 两 个 术语 。 我 们 在 本 书 中 
将 更 为 精确 地 使 用 这 些 术语 。 转 发 (forwarding) 是 指 将 分 组 从 一 个 输入 链 路 接口 转移 到 
适当 的 输出 链 路 接口 的 路 由 需 本 地 动作 。 转 发 发 生 的 时 间 斥 度 很 短 (通常 为 几 纳 秒 )， 因 
此 通常 用 硬件 来 实现 。 路 由 选择 (routing) 是 指 确定 分 组 从 源 到 目的 地 所 采取 的 端 到 端 路 
径 的 网 络 范围 处 理 过 程 。 路 由 选择 发 生 的 时 间 尺 度 长 得 多 (通常 为 几 秒 )， 因 此 通常 用 软 
件 来 实现 。 用 驾驶 的 例子 进行 类 比 ， 考 虑 在 1.3. 1 节 中 旅行 者 所 历经 的 从 宾夕法尼亚 州 到 
佛罗里达 州 的 行程 。 在 这 个 行程 中 ， 那 位 驾驶 员 在 到 佛罗里达 州 的 途中 经 过 了 许多 立交 
桥 。 我 们 能 够 认为 转发 就 像 通过 单个 立交 桥 的 过 程 : 一 辆 汽车 从 其 道路 上 进入 立交 桥 的 一 
个 人口， 并 且 决 定 应 当 走 哪 条 路 来 离开 该 立交 桥 。 我 们 可 以 把 路 由 选择 看 作 是 规划 从 宾 夕 
法 尼 亚 州 到 佛罗里达 州 行程 的 过 程 : 在 着 手 行程 之 前 ， 驾 驶 员 已 经 查阅 了 地 图 并 在 许多 可 
能 的 路 径 中 选择 一 条 ， 其 中 每 条 路 径 都 由 一 系列 经 立交 桥 连 接 的 路 段 组 成 。 
每 台 网 络 路 由 器 中 有 一 个 关键 元 素 是 它 的 转发 表 (forwarding table) 。 路 由 器 检查 到 达 
分 组 首部 的 一 个 或 多 个 字段 值 ， 进 而 使 用 这 些 首 部 值 在 其 转发 表 中 索引 ， 通 过 这 种 方法 来 
转发 分 组 。 这 些 值 对 应 存储 在 转发 表 项 中 的 值 ， 指 出 了 该 分 组 将 被 转发 的 路 由 器 的 输出 链 
路 接口 。 例 如 在 图 4-2 中 ， 一 个 首部 字段 值 为 0111 的 分 组 到 达 路 由 器 。 该 路 由 器 在 它 的 
转发 表 中 索引 ， 并 确定 该 分 组 的 输出 链 路 接口 是 接口 2。 该 路 由 器 则 在 内 部 将 该 分 组 转发 
到 接口 2。 在 4.2 节 中 ,我们 深入 路 由 需 内 部 ， 更 为 详细 地 研究 这 种 转发 功能 。 转 发 是 由 





图 4-2 路 由 选择 算法 决定 转发 表 中 的 值 
1. 控制 平面 : 传统 的 方法 
你 也 许 现在 想 知道 路 由 器 中 的 转发 表 一 开始 是 如 何 配置 的 。 这 是 一 个 关键 问题 ， 它 揭 
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示 了 路 由 选择 和 转发 间 的 重要 相互 作用 关系 。 如 图 4-2 所 示 ， 路 由 选择 算法 决定 了 插入 该 
路 由 器 转发 表 的 内 容 。 在 这 个 例子 中 ， 路 由 选择 算法 运行 在 每 台 路 由 器 中 ， 并 且 在 每 台 路 
由 器 中 都 包含 转发 和 路 由 选择 两 种 功能 。 如 我 们 将 在 5.3 节 和 5.4 节 中 所 见 ， 在 一 台 路 由 
器 中 的 路 由 选择 算法 与 在 其 他 路 由 器 中 的 路 由 选择 算法 通信 ， 以 计算 出 它 的 转发 表 的 值 。 
这 种 通信 是 如 何 执行 的 呢 ? 通过 根据 路 由 选择 协议 交换 包含 路 由 选择 信息 的 路 由 选择 报 
X! 我 们 将 在 5.2 ~5.4 节 讨 论 路 由 选择 算法 和 协议 。 

通过 考虑 网 络 中 的 假想 情况 (不 真实 的 ， 但 技术 上 是 可 行 的 ) ， 也 就 是 说 路 由 器 中 物 
理 上 存在 的 所 有 转发 表 的 内 容 是 由 人 类 网 络 操作 员 直 接 配 置 的 ， 进 一 步 说 明 转 发 和 路 由 选 
择 功 能 的 区 别 和 不 同 目的 。 在 这 种 情况 下 ， 不 需要 任何 路 由 选择 协议 ! 当然 ， 这 些 人 类 操 
作 员 将 需要 彼此 交互 ， 以 确保 该 转发 表 的 配置 能 使 分 组 到 达 它 们 想 要 到 达 的 目的 地 。 出 现 
下 列 现象 也 很 可 能 : 人 工 配置 更 容易 出 错 ， 并 且 对 于 网 络 拓扑 变化 的 响应 比 起 路 由 选择 协 
议 来 更 慢 。 我 们 要 为 所 有 网 络 具 有 转发 和 路 由 选择 功能 而 感到 幸运 ! 

2. 控制 平面 : SDN 方法 

图 4-2 中 显示 的 实现 路 由 选择 功能 的 方法 ， 是 路 由 选择 厂商 在 其 产品 中 采用 的 传统 方 
法 ,至 少 最 近 还 是 如 此 。 使 用 该 方法 ， 每 台 路 由 器 都 有 一 个 与 其 他 路 由 器 的 路 由 选择 组 件 
通信 的 路 由 选择 组 件 。 然 而 ， 对 人 类 能 够 手动 配置 转发 表 的 观察 启发 我 们 ， 对 于 控制 平面 
功能 来 说 ， 也 许 存 在 其 他 方式 来 确定 数据 平面 转发 表 的 内 容 。 

图 4-3 显示 了 从 路 由 器 物理 上 分 离 的 另 一 种 方法 ， 远 程控 制 器 计算 和 分 发 转发 表 以 供 
每 台 路 由 器 所 使 用 。 注 意 到 图 4-2 和 图 4-3 的 数据 平面 组 件 是 相同 的 。 而 在 图 4-3 中 ， 控 
制 平面 路 由 选择 功能 与 物理 的 路 由 器 是 分 离 的 ， 即 路 由 选择 设备 仅 执行 转发 ， 而 远程 控制 
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图 4-3 ”远程 控制 器 确定 并 分 发 转发 表 中 的 值 
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器 计算 并 分 发 转发 表 。 远 程控 制 器 可 能 实现 在 具有 高 可 靠 性 和 了 元 余 的 远程 数据 中 心中 ， 并 
可 能 由 ISP 或 某 些 第 三 方 管理 。 路 由 器 和 远程 控制 器 是 如 何 通信 的 呢 ? 通过 交换 包含 转发 
表 和 其 他 路 由 选择 信息 的 报 文 。 显 示 在 图 4-3 中 的 控制 平面 方法 是 软件 定义 网 络 (Soft- 
ware- Defined Networking, SDN) 的 本 质 ， 因 为 计算 转发 表 并 与 路 由 船 交互 的 控制 部 是 用 软 
件 实现 的 ， 故 网 络 是 “软件 定义 ”的 。 这 些 软件 实现 也 越 来 越 开 放 ， 换 言 之 类 似 于 Linux 
操作 系统 代码 ， 这 些 代码 可 为 公众 所 用 ， 人 允许 SP 〈 以 及 网 络 研究 者 和 学 生 ) 去 创新 并 对 
控制 网 络 层 功能 的 软件 提出 更 改建 议 。 我 们 将 在 5.5 节 中 讨论 SDN 控制 平面 。 


4.1.2 网 络 服务 模型 


在 钻研 网 络 层 的 数据 平面 之 前 ， 我 们 将 以 开阔 的 视野 来 专注 于 我 们 引入 的 新 东西 并 考 
虑 网 络 层 可 能 提供 的 不 同类 型 的 服务 。 当 位 于 发 送 主机 的 运输 层 向 网 络 传输 分 组 时 ( 即 在 
发 送 主机 中 将 分 组 向 下 交 给 网 络 层 ) ， 运 输 层 能 够 指望 网 络 层 将 该 分 组 交付 给 目的 地 吗 ? 
当 发 送 多 个 分 组 时 ， 它 们 会 按 发 送 顺 序 按 序 交 付 给 接收 主机 的 运输 层 吗 ? 发 送 两 个 连续 分 
组 的 时 间 间 隔 与 接收 到 这 两 个 分 组 的 时 间 间 隅 相同 吗 ? 网 络 层 会 提供 关于 网 络 中 拥塞 的 反 
馈 信 息 吗 ? 在 发 送 主机 与 接收 主机 中 连接 运输 层 通道 的 抽象 视图 (特性 ) 是 什么 ”对 这 些 
问题 和 其 他 问题 的 答案 由 网 络 层 提供 的 服务 模型 所 决定 。 网 络 服务 模型 (network service 
model) 定义 了 分 组 在 发 送 与 接收 端 系统 之 间 的 端 到 端 运输 特性 。 
我 们 现在 考虑 网 络 层 能 提供 的 某 些 可 能 的 服务 。 这 些 服务 可 能 包括 : 
e 确保 交付 。 该 服务 确保 分 组 将 最 终 到 达 目 的 地 。 
© 具有 时 延 上 界 的 确保 交付 。 该 服务 不 仅 确 保 分 组 的 交付 ， 而 且 在 特定 的 主机 到 主机 
时 延 上 界 内 〈 例 如 在 100ms A) 交付 。 
© 有 序 分 组 交付 。 该 服务 确保 分 组 以 它们 发 送 的 顺序 到 达 目 的 地 。 
© 确保 最 小 带宽 。 这 种 网 络 层 服务 模仿 在 发 送 和 接收 主机 之 间 一 条 特定 比特 率 (例如 
1Mbps) 的 传输 链 路 的 行为 。 只 要 发 送 主机 以 低 于 特定 比特 率 的 速率 传输 比特 ( 作 
为 分 组 的 组 成 部 分 ) ， 则 所 有 分 组 最 终 会 交付 到 目的 主机 。 
e 安全 性 。 网 络 层 能 够 在 源 加 密 所 有 数据 报 并 在 目的 地 解密 这 些 分 组 ， 从 而 对 所 有 运 
输 层 报 文 段 提 供 机 密 性 。 
这 只 是 网 络 层 能 够 提供 的 服务 的 部 分 列表 ， 有 无 数 种 可 能 的 服务 变种 。 
因特网 的 网 络 层 提供 了 单一 的 服务 ， 称 为 尽力 而 为 服务 (best-effort service), 。 使 用 尽 
力 而 为 服务 ， 传 送 的 分 组 既 不 能 保证 以 它们 发 送 的 顺序 被 接收 ， 也 不 能 保证 它们 最 终 交 
付 ; 既 不 能 保证 端 到 端 时 延 ， 也 不 能 保证 有 最 小 的 带宽 。 尽 力 而 为 服务 看 起 来 是 根本 无 服 
务 的 一 种 委婉 说 法 ， 即 一 个 没有 向 目的 地 交付 分 组 的 网 络 也 符合 尽力 而 为 交付 服务 的 定 
X! 其 他 的 网 络 体系 结构 已 定义 和 实现 了 超过 因特网 尽力 而 为 服务 的 服务 模型 。 例 如 ， 
ATM 网 络 体系 结构 [MFA Forum 2016; Black 1995] 提供 了 确保 按 序 时 延 、 有 界 时 延 和 确 
保 最 小 带宽 。 还 有 提议 的 对 因特网 体系 结构 的 服务 模型 扩展 ， 例 如 ， 集 成 服务 体系 结构 
[RFC 1633] 的 目标 是 提供 端 到 端 时 延 保 证 以 及 无 拥塞 通信 。 令 人 感 兴趣 的 是 ， 尽 管 有 这 
些 研发 良好 的 供 选 方案 , 但 因特网 的 基本 尽力 而 为 服务 模型 与 适当 带宽 供给 相 结 合 已 被 证 
明 超 过 “足够 好 ”， 能 够 用 于 大 量 的 应 用 ， 包 括 诸如 Netflix, IP 语音 和 视频 等 流 式 视频 服 
务 ， 以 及 诸如 Skype 和 Facetime 等 实时 会 议 应 用 。 
第 4 章 概 述 


在 提供 了 网 络 层 的 概述 后 ， 我 们 将 在 本 章 后 续 几 节 中 讨论 网 络 层 的 数据 平面 组 件 。 在 
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4.2 节 中 ,我们 将 深入 探讨 路 由 器 的 内 部 人 硬件 操作 ， 包 括 输入 和 输出 分 组 处 理 、 路 由 需 的 
内 部 交换 机 制 以 及 分 组 排队 和 调度 。 在 4.3 节 中 ,我 们 将 学 习 传 统 的 IP 转发， 其 中 分 组 
基于 它们 的 目的 IP 地址 转发 到 输出 端口 。 我 们 将 学 习 到 IP 寻 址 、 令 人 称道 的 IPv4 和 IPv6 
协议 等 。 在 4.4 节 中 ， 我 们 将 涉及 更 为 一 般 的 转发 ， 此 时 分 组 可 以 基于 大 量 首部 值 〈 即 不 
仅 基于 目的 他 地 址 ) 转发 到 输出 端口 。 分 组 可 能 在 路 由 器 中 受阻 或 元 余 ， 或 者 可 能 让 某 
些 首 部 字段 重 写 ， 即 所 有 都 在 软件 控制 之 下 完成 。 这 种 分 组 转发 的 更 为 一 般 的 形式 是 现代 
网 络 数据 平面 的 关键 组 件 , -包括 软件 定义 网 络 (SDN) 中 的 数据 平面 。 

我 们 在 这 里 顺便 提 到 ， 许 多 计算 机 网 络 研 究 者 和 从 业 人 员 经 常 互 换 地 使 用 转发 和 交换 
这 两 个 术语 。 我 们 在 这 本 教科 书 中 也 将 互 换 使 用 这 些 术 语 。 在 我 们 开始 讨论 术语 的 主题 
时 ， 还 需要 指出 经 常 互 换 使 用 的 两 个 其 他 术语 ， 但 我 们 将 更 为 小 心地 使 用 它们 。 我 们 将 约 
定 术 语 分 组 交换 机 是 指 一 台 通 用 分 组 交换 设备 ， 它 根据 分 组 首部 字段 中 的 值 ， 从 输入 链 路 
接口 到 输出 链 路 接口 转移 分 组 。 某 些 分 组 交换 机 称 为 链 路 层 交 换 机 ( link- layer switch ) 
(在 第 6 章 仔 细 学 习 ) ， 基 于 链 路 层 帧 中 的 字段 值 做 出 转发 决定 ， 这 些 交 换 机 因此 被 称 为 链 
路 层 〈 第 2 层 ) 设备 。 其 他 分 组 交换 机 称 为 路 由 器 (router) ， 基 于 网 络 层 数 据 报 中 的 首部 
字段 值 做 出 转发 决定 。 路 由 器 因此 是 网 络 层 (第 3 层 ) 设备 。( 为 了 全 面 理解 这 种 重要 区 
别 ， 你 可 能 要 回顾 1.5.2 节 ， 在 那里 我 们 讨论 了 网 络 层 数据 报 和 链 路 层 帧 及 其 关系 。) A 
为 在 本 章 中 我 们 关注 的 是 网 络 层 ， 所 以 我 们 将 主要 使 用 术语 路 由 器 来 代替 交换 机 。 


4.2 ”路 由 器 工作 原理 


既然 我 们 已 经 概述 了 网 络 层 中 的 数据 平面 和 控制 平面 、 转 发 与 路 由 选择 之 间 的 重要 区 
别 以 及 网 络 层 的 服务 与 功能 ， 我 们 将 注意 力 转 向 网 络 层 的 转发 功能 ， 即 实际 将 分 组 从 一 人 台 
路 由 需 的 人 链 路 传送 到 适当 的 出 链 路 。 

图 4-4 显示 了 一 个 通用 路 由 器 体系 结构 的 总 体 视 图 ， 其 中 标识 了 一 台 路 由 器 的 4 个 
组 件 。 







路 由 选择 ， 管 理 
控制 平面 ( 软件 ) 


4-4 路 由 器 体系 结构 


e 输入 端口 。 输 入 端口 〈input port) 执行 几 项 重要 功能 。 它 在 路 由 器 中 执行 终结 人 物 
理 链 路 的 物理 层 功 能 ， 这 显示 在 图 4-4 中 输入 端口 部 分 最 左 侧 的 方 框 与 输出 端口 部 
分 最 右 侧 的 方 框 中 。 它 还 要 与 位 于 入 链 路 远 端的 数据 链 路 层 交 互 来 执行 数据 链 路 层 
功能 ， 这 显示 在 输入 与 输出 端口 部 分 中 间 的 方 框 中 。 也 许 更 为 重要 的 是 ， 在 输入 端 


204 i a¥ 


口 还 要 执行 查找 功能 ， 这 显示 在 输入 端口 最 右 侧 的 方 框 中 。 正 是 在 这 里 ， 通 过 查询 
转发 表决 定 路 由 器 的 输出 端口 ， 到 达 的 分 组 通过 路 由 器 的 交换 结构 转发 到 输出 端 
口 。 控 制 分 组 〈 如 携带 路 由 选择 协议 信息 的 分 组 ) 从 输入 端口 转发 到 路 由 选择 处 
理 器 。 注 意 这 里 的 “端口 ”一 词 ， 指 的 是 路 由 器 的 物理 输入 和 输出 接口 ， 这 完全 
不 同 于 第 2、3 章 中 所 讨论 的 与 网 络 应 用 程序 和 套 接 字 相 关联 的 软件 端口 。 在 实践 
中 ， 一 人 台 路 由 器 所 支持 的 端口 数量 范围 较 大 ， 从 企业 路 由 器 具有 数量 相对 少 的 端 
口 ， 到 位 于 某 ISP 边缘 的 路 由 器 具有 数 以 百 计 10Gbps 端口 (其 中 入 线路 的 数量 赵 
于 最 大 ) 。 例 如 ， 边 缘 路 由 器 Juniper MX2020 具有 80Tbps 的 总 体 路 由 器 系统 容量 ， 
文 持 多 达 960 个 10Gbps 以 太 网 端口 [Juniper MX 2020 2016] 。 

交换 结构 。 交 换 结 构 将 路 由 器 的 输入 端口 连接 到 它 的 输出 端口 。 这 种 交换 结构 完全 
包含 在 路 由 器 之 中 ， 即 它 是 一 个 网 络 路 由 器 中 的 网 络 ! 

输出 端口 。 输 出 端口 存储 从 交换 结构 接收 的 分 组 ， 并 通过 执行 必要 的 链 路 层 和 物理 
层 功能 在 输出 链 路 上 传输 这 些 分 组 。 当 一 条 链 路 是 双向 的 时 ( 即 承载 两 个 方向 的 流 
量 )， 输 出 端口 通常 与 该 链 路 的 输入 端口 成 对 出 现在 同一 线路 卡 上 。 

路 由 选择 处 理 器 。 路 由 选择 处 理 需 执行 控制 平面 功能 。 在 传统 的 路 由 器 中 ， 它 执行 
路 由 选择 协议 (我们 将 在 5.3 节 和 5. 4 节 学 习 ) ， 维 护 路 由 选择 表 与 关联 链 路 状态 
信息 ， 并 为 该 路 由 器 计算 转发 表 。 在 SDN 路 由 器 中 ， 路 由 选择 处 理 器 (在 其 他 活 
动 中 ) 负责 与 远程 控制 器 通信 ， 目 的 是 接收 由 远程 控制 器 计算 的 转发 表 项 ， 并 在 该 
路 由 需 的 输入 端口 安装 这 些 表 项 。 路 由 选择 处 理 器 还 执行 网 络 管理 功能 ， 我 们 将 在 
5.7 节 学 习 相关 内 容 。 

路 由 器 的 输入 端口 、 输 出 端口 和 交换 结构 几乎 总 是 用 硬件 实现 ， 如 图 4-4 所 示 。 为 了 
理解 为 何 需要 用 硬件 实现 ， 考 虑 具有 10Cbps 输入 链 路 和 64 字 节 的 人 数据 报 ， 其 输入 端口 
在 另 一 个 数据 报到 达 前 仅 有 51. 2ns 来 处 理 数据 报 。 如 果 NN 个 端口 结合 在 一 块 线 路 卡 上 
(因为 实践 中 常常 这 样 做 ) ， 数 据 报 处 理 流水 线 必须 以 N 倍速 率 运 行 ， 这 远 快 过 软件 实现 
的 速率 。 转 发 硬件 既 能 够 使 用 路 由 器 厂商 自己 的 硬件 设计 来 实现 ， 也 能 够 使 用 购买 的 商用 
硅 片 (例如 由 英特尔 和 Broadcom 公司 所 出 售 ) 的 硬件 设计 来 实现 。 

当 数 据 平面 以 纳 秒 时 间 斥 度 运行 时 ， 路 由 器 的 控制 功能 以 毫秒 或 秒 时 间 尺 度 运 行 ， 这 
些 控制 功能 包括 执行 路 由 选择 协议 、 对 上 线 或 下 线 的 连接 链 路 进行 响应 、 与 远程 控制 器 通 
言 ( 在 SDN 场合) 和 执行 管理 功能 。 因 而 这 些 控制 平面 (control plane) 的 功能 通常 用 软 
件 实现 并 在 路 由 选择 处 理 器 (通常 是 一 种 传统 的 CPU) 上 执行 。 

在 深入 探讨 路 由 器 的 内 部 细节 之 前 ， 我 们 转向 本 章 开 头 的 那个 类 比 ， 其 中 分 组 转发 好 
比 汽车 进入 和 离开 立交 桥 。 假 定 该 立交 桥 是 环 状 交叉 路 ， 在 汽车 进入 该 环 状 交 叉 路 前 ， 需 
要 做 一 点 处 理 。 我 们 来 考虑 一 下 对 于 这 种 处 理 需 要 什么 信息 。 

e 基于 目的 地 转发 。 假 设 汽车 停 在 一 个 人 口 站 上 并 指示 它 的 最 终 目的 地 (并 非 在 本 地 

环 状 交叉 路 ， 而 是 其 旅途 的 最 终 目 的 地 ) 。 人 入口 站 的 一 名 服务 人 员 查 找 最 终 目的 地 ， 
决定 通 回 最 后 目的 地 的 环 状 交 叉 路 的 出 口 ， 并 告诉 四 驶 员 要 走 哪个 出 口 。 

e 通用 转发 。 除 了 目的 地 之 外 ， 服 务 人 员 也 能 够 基于 许多 其 他 因素 确定 汽车 的 出 口 功 

道 。 例 如 ， 所 选择 的 出 口 熙 道 可 能 与 该 汽车 的 起 点 如 发 行 该 车 牌照 的 州 有 关 。 来 自 
某 些 州 的 汽车 可 能 被 引导 使 用 某 个 出 口 熙 道 (经 过 一 条 慢 速 道路 通 向 目的 地 ) ， 而 
来 自 其 他 州 的 汽车 可 能 被 引导 使 用 一 个 不 同 的 出 口 臣 道 (经 过 一 条 高 速 路 通 回 目的 
地 ) 。 基 于 汽车 的 模型 、 品 牌 和 寿命 ， 可 能 做 出 相同 的 决定 。 或 者 认为 不 适合 上 路 


MBE: REF A 205 


的 汽车 可 能 被 阻止 并 且 不 允许 通过 环 状 交叉 路 。 就 通用 转发 来 说 ， 许 多 因素 都 会 对 
服务 人 员 为 给 定 汽车 选择 出 口 臣 道 产生 影响 。 

一 旦 汽车 进入 环 状 交叉 路 (该 环 状 交 又 路 可 能 挤 满 了 从 其 他 输入 道路 进入 的 其 他 汽 
车 ， 朝 着 其 他 环 状 交 叉 路 出 口 前 进 ) ， 并 且 最 终 离 开 预 定 的 环 状 交叉 路 出 口 熙 道 ， 在 这 里 
可 能 遇 到 了 从 该 出 口 离开 环 状 交 又 路 的 其 他 汽车 。 

在 这 个 类 比 中 ， 我 们 能 够 在 图 4-4 中 识别 最 重要 的 路 由 器 组 件 : 入 口 道路 和 入 口 站 对 
应 于 输入 端口 《具有 查找 功能 以 决定 本 地 输出 端口 ) ; 环 状 交叉 路 对 应 于 交换 结构 ; 环 状 
交叉 路 出 口 焉 道 对 应 于 输出 端口 。 借 助 于 这 个 类 比 ， 我 们 可 以 考虑 瓶颈 可 能 出 现 的 地 方 。 
如 果 汽 车 以 极 快 的 速率 到 达 ( 例 如， 该 环 状 交 又 路 位 于 德国 或 意大利 !) 而 车 站 服务 人 员 
很 慢 ， 将 发 生 什 么 情况 ?这些 服 务 人 员 必 须 工 作 得 多 快 ， 以 确保 在 人 口 路 上 没有 车 辆 拥 
堵 ? 甚至 对 于 极 快 的 服务 人 员 ， 如 果 汽 车 在 环 状 交 叉 路 上 开 得 很 慢 ， 将 发 生 什 么 情况 ， 拥 
堵 仍 会 出 现 吗 ? 如 果 大 多 数 进 入 的 汽车 都 要 在 相同 的 出 口 熙 道 离开 环 状 交叉 路 ， 将 发 生 什 
么 情况 ， 在 出 口 焉 道 或 别 的 什么 地 方 会 出 现 拥堵 吗 ? 如 果 我 们 要 为 不 同 的 汽车 分 配 优先 
权 ， 或 先行 阻挡 某 些 汽车 进入 环 状 交 义 路 ， 环 状 交 叉 路 将 如 何 运 行 ? 这 些 全 都 与 路 由 器 和 
交换 机 设计 者 面 对 的 问题 形成 类 比 。 

在 下 面 的 各 小 节 中 ， 我 们 将 更 为 详细 地 考察 路 由 器 功能 。 | Iyer 2008; Chao 2001; 
Chuang 2005; Turner 1988; McKeown 1997a; Partridge 1998; Sopranos 2011] 提供 了 对 一 
些 特定 路 由 器 体系 结构 的 讨论 。 为 了 具体 和 简单 起 见 ， 我 们 在 本 节 中 初始 假设 转发 决定 仅 
基于 分 组 的 目的 地 址 ， 而 非 基于 通用 的 分 组 首部 字段 。 我 们 将 在 4. 4 节 中 学 习 更 为 通用 的 
分 组 转发 情况 。 


4.2.1 输入 端口 处 理 和 基于 目的 地 转发 


图 4-5 中 显示 了 一 个 更 详细 的 输入 处 理 的 视图 。 如 前 面 讨论 的 那样 ， 输 入 端口 的 线 
路 端 接 功 能 与 链 路 层 处 理 实现 了 用 于 各 个 输入 链 路 的 物理 层 和 链 路 层 。 在 输入 端口 中 执 
行 的 查找 对 于 路 由 器 运行 是 至 关 重 要 的 。 正 是 在 这 个 地 方 ， 路 由 器 使 用 转发 表 来 查找 输 
出 闯 口 ， 使 得 到 达 的 分 组 能 经 过 交换 结构 转发 到 该 输出 端口 。 转 发 表 是 由 路 由 选择 处 理 
器 计算 和 更 新 的 (使 用 路 由 选择 协议 与 其 他 网 络 路 由 器 中 的 路 由 选择 处 理 器 进行 交 
互 ) ， 或 者 转发 表 接收 来 自 远程 SDN 控制 器 的 内 容 。 转 发 表 从 路 由 选择 处 理 器 经 过 独立 
总 线 (例如 一 个 PCI 总 线 ) 复制 到 线路 卡 ， 在 图 4-4 中 该 总 线 由 从 路 由 选择 处 理 器 到 输 
入 线路 卡 的 虚线 所 指示 。 使 用 在 每 个 输入 端口 的 影子 副本 ， 转 发 决策 能 在 每 个 输入 端口 
本 地 做 出 ， 无 须 基于 每 个 分 组 调用 集中 式 路 由 选择 处 理 器 ， 因 此 避免 了 集中 式 处 理 的 
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现在 我 们 来 考虑 “最 简单 ”的 情况 ， 一 个 人 分 组 基于 该 分 组 的 目的 地 址 交换 到 输出 端 
口 。 在 32 比特 IP 地址 的 情况 下 ， 转 发 表 的 蛮 力 实现 将 针对 每 个 目的 地 址 有 一 个 表 项 。 因 
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图 4-5 输入 端口 处 理 
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为 有 超过 40 亿 个 可 能 的 地 址 ， 选 择 这 种 方法 总 体 上 是 不 可 行 的 。 
作为 一 个 说 明 怎 样 处 理 规模 问题 的 例子 ， 假 设 我 们 的 路 由 占 具 有 4 条 链 路 ， 编 号 0 到 
3， 分 组 以 如 下 方式 转发 到 链 路 接口 : 
目的 地 址 范围 链 路 接口 


11001000 00010111 00010000 00000000 


到 | 0 
11001000 00010111 00010111 11111111 


11001000 00010111 00011000 00000000 
到 | l 
11001000 00010111 00011000 11111111 


11001000 00010111 00011001 00000000 
到 
11001000 00010111 00011111 11111111 


其 他 3 
显然 ， 对 于 这 个 例子 ， 在 路 由 器 的 转发 表 中 没有 必要 有 40 亿 个 表 项 。 例 如 ， 我 们 能 
够 有 一 个 如 下 仅 包 括 4 个 表 项 的 转发 表 : 


Bu ZAVE Ac 链 路 接口 
11001000 00010111 00010 0 
11001000 00010111 00011000 | 
11001000 00010111 00011 2 

其 他 3 


使 用 这 种 风格 的 转发 表 ， 路 由 器 用 分 组 目的 地 址 的 前 缀 (prefix) 与 该 表 中 的 表 项 进 
行 匹 配 ; 如 果 存 在 一 个 匹配 项 ， 则 路 由 器 向 与 该 匹配 项 相关 联 的 链 路 转发 分 组 。 例 如 ， 假 
设 分 组 的 目的 地 址 是 11001000 00010111 00010110 10100001 ， 因 为 该 地 址 的 21 Le AT ARDC 
配 该 表 的 第 一 项 ， 所 以 路 由 器 向 链 路 接口 0 转发 该 分 组 。 如 果 一 个 前 组 不 匹配 前 3 项 中 的 
任何 一 项 ， 则 路 由 器 向 链 路 接口 3 转发 该 分 组 。 尽 管 听 起 来 足够 简单 ， 但 这 里 还 是 有 重要 
的 微妙 之 处 。 你 可 能 已 经 注意 到 一 个 目的 地 址 可 能 与 不 止 一 个 表 项 相 匹 配 。 例 如 ， 地 址 
11001000 00010111 00011000 10101010 的 前 24 比特 与 表 中 的 第 二 项 匹配 ， 而 该 地 址 的 前 
21 比特 与 表 中 的 第 三 项 匹配 。 当 有 多 个 匹配 时 ， 该 路 由 器 使 用 最 长 前 缀 匹配 规则 (longest 
prefix matching rule); 即 在 该 表 中 寻找 最 长 的 匹配 项 ， 并 回 与 最 长 前 缀 匹配 相关 联 的 链 路 
接口 转发 分 组 。 当 在 4. 3 节 中 详细 学 习 因 特 网 编 址 时 ， 我 们 将 完全 明白 使 用 这 种 最 长 前 级 
匹配 规则 的 理由 。 

假定 转发 表 已 经 存在 ， 从 概念 上 讲 表 查找 是 简单 的 ， 硬 件 逻 辑 只 是 搜索 转发 表 查 找 最 
长 前 缀 匹配 。 但 在 吉 比 特 速率 下 ， 这 种 查找 必须 在 纳 秒 级 执行 〈 回 想 我 们 前 面 10Cbps 链 
路 和 一 个 64 字 节 IP 数据 报 的 例子 ) 。 因 此 ， 不 仅 必 须要 用 硬件 执行 查找 ， 而 且 需 要 对 大 
型 转发 表 使 用 超出 简单 线性 搜索 的 技术 ; 快速 查找 算法 的 综述 能 够 在 [Gupta 2001, Ruiz- 
Sanchez 2011] 中 找到 。 同 时 必须 对 内 存 访 问 时 间 给 予 特别 关注 ， 这 导致 用 区 入 式 片 上 
DRAM 和 更 快 的 SRAM (用 作 一 种 DRAM BFF) 内 存 来 设计 。 实 践 中 也 经 常 使 用 三 态 内 容 
可 寻 址 存储 器 (Tenary Content Address Memory, TCAM) 来 查找 [Yu 2004]. 。 使 用 TCAM, 
一 个 32 比特 IP 地 址 被 放 人 内 存 ，TCAM 在 基本 常数 时 间 内 返回 对 该 地 址 的 转发 表 项 的 内 
容 。Cisco Catalyst 6500 和 7500 系列 路 由 器 及 交换 机 能 够 保存 100 多 万 TCAM 转发 表 项 
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| Cisco TCAM 2014 | 。 

一 旦 通过 查找 确定 了 某 分 组 的 输出 端口 ， 则 该 分 组 就 能 够 发 送 进 入 交换 结构 。 在 某 些 
没 计 中 ， 如 果 来 和 目 其 他 输入 端口 的 分 组 当前 正在 使 用 该 交换 结构 ， 一 个 分 组 可 能 会 在 进入 
交换 结构 时 被 暂时 阻 寨 。 因 此 ， 一 个 被 阻塞 的 分 组 必须 要 在 输入 端口 处 排队 ， 并 等 竺 稍 后 
被 及 时 调度 以 通过 交换 结构 。 我 们 稍 后 将 仔细 观察 分 组 (位 于 输入 端口 与 输出 端口 中 ) 的 
阻塞 、 排 队 与 调度 。 尽 管 “ 查 找 ” 在 输入 端口 处 理 中 可 认为 是 最 为 重要 的 动作 ， 但 必须 采 
取 许 多 其 他 动作 : 由 必 须 出 现 物理 层 和 链 路 层 处 理 ， 如 前 面 所 讨论 的 那样 ;，@) 必 须 检 查分 
组 的 版 本 号 、 检 验 和 以 及 寿命 字段 (这 些 我 们 将 在 4.3 节 中 学 习 ) ， 并 且 重 写 后 两 个 字段 ; 
(必须 更 新 用 于 网 络 管理 的 计数 器 ( 如 接收 到 的 IP 数据 报 的 数目 )。 

在 结束 输入 端口 处 理 的 讨论 之 前 ， 注 意 到 输入 端口 查找 目的 IP 地 址 (“匹配”) ， 然 后 
发 送 该 分 组 进入 交换 结构 (“动作”) 的 步骤 是 一 种 更 为 一 般 的 “匹配 加 动作 ”抽象 的 特 
定 情况 ， 这 种 抽象 在 许多 网 络 设备 中 执行 ， 而 不 仅 在 路 由 需 中 。 在 链 路 层 交 换 机 〈 在 第 6 
章 讨论 ) 中 ， 除 了 发 送 帧 进入 交换 结构 去 往 输 出 端口 外 ， 还 要 查找 链 路 层 目的 地 址 ， 并 条 
取 几 个 动作 。 在 防火 墙 (在 第 8 章 讨 论 ) 中 ,首部 匹配 给 定 准 则 〈 例 如 源 / 目 的 TP 地 址 和 
运输 层 端 口号 的 某 种 组 合 ) 的 人 分 组 可 能 被 阻止 转发 ， 而 防火 墙 是 一 种 过 滤 所 选择 的 和 人 分 
组 的 设备 。 在 网 络 地 址 转换 器 (NAT, 在 4.3 节 讨 论 ) 中 ， 一 个 运输 层 端口 号 匹配 某 给 定 
值 的 人 分 组 ， 在 转发 (动作 ) 前 其 端口 号 将 被 重 写 。 的 确 , “匹配 加 动作 ”抽象 不 仅 作用 
大 ， 而 且 在 网 络 设备 中 无 所 不 在 ， 并 且 对 于 我 们 将 在 4. 4 节 中 学 习 的 通用 转发 是 至 关 重 
要 的 。 

4.2.2 交换 


交换 结构 位 于 一 台 路 由 需 的 核心 部 位 ， 因 为 正 是 通过 这 种 交换 结构 ， 分 组 才能 实际 地 
从 一 个 输入 端口 交换 ( 即 转 发 ) 到 一 个 输出 端口 中 。 交 换 可 以 用 许多 方式 完成 ， 如 图 4-6 
所 示 。 
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经 内 存 交 换 。 最 简单 、 最 早 的 路 由 器 是 传统 的 计算 机 ， 在 输入 端口 与 输出 端口 之 
间 的 交换 是 在 CPU (路 由 选择 处 理 器 ) 的 直接 控制 下 完成 的 。 输 入 与 输出 端口 的 
功能 就 像 在 传统 操作 系统 中 的 VO 设备 一 样 。 一 个 分 组 到 达 一 个 输入 端口 时 ， 该 
端口 会 先 通过 中 断 方 式 向 路 由 选择 处 理 器 发 出 信号 。 于是， 该 分 组 从 输入 端口 处 
被 复制 到 处 理 器 内 存 中 。 路 由 选择 处 理 器 则 从 其 首部 中 提取 目的 地 址 ， 在 转发 表 
中 找 出 适当 的 输出 端口 ， 并 将 该 分 组 复制 到 输出 端口 的 缓存 中 。 在 这 种 情况 下 ， 
如 果 内 存 带 宽 为 每 秒 可 写 进 内 存 或 从 内 存 读 出 最 多 B 个 分 组 ， 则 总 的 转发 吞吐 量 
(分 组 从 输入 端口 被 传送 到 输出 端口 的 总 速率 ) 必然 小 于 B/2。 也 要 注意 到 不 能 同 
时 转发 两 个 分 组 ， 即 使 它们 有 不 同 的 目的 端口 ， 因 为 经 过 共享 系统 总 线 一 次 仅 能 
执行 一 个 内 存 读 / 写 。 

许多 现代 路 由 器 通过 内 存 进 行 交 换 。 然 而 ， 与 早期 路 由 需 的 一 个 主要 差别 是 ， 
目的 地 址 的 查找 和 将 分 组 存储 ( 交换) 进 适 当 的 内 存 存储 位 置 是 由 输入 线路 卡 来 
处 理 的 。 在 某 些 方面 ， 经 内 存 交 换 的 路 由 器 看 起 来 很 像 共 享 内 存 的 多 处 理 器 ， 用 
一 个 线路 卡 上 的 处 理 将 分 组 交换 〈 写 ) 进 适 当 的 输出 端口 的 内 存 中 。Cisco 的 Cat- 
alyst 8500 系列 的 交换 机 | Cisco 8500 2016 | 是 经 共享 内 存 转发 分 组 的 。 
经 总 线 交 换 。 在 这 种 方法 中 ， 输 入 端口 经 一 根 共 享 总 线 将 分 组 直接 传送 到 输出 端 
口 ， 不 需要 路 由 选择 处 理 器 的 和 干预。 通常 按 以 下 方式 完成 该 任务 : 让 输入 端口 为 
分 组 预先 计划 一 个 交换 机 内 部 标签 (首部) ， 指 示 本 地 输出 端口 ， 使 分 组 在 总 线 上 
传送 和 传输 到 输出 端口 。 该 分 组 能 由 所 有 输出 端口 收 到 ， 但 只 有 与 该 标签 匹配 的 
端口 才能 保存 该 分 组 。 然 后 标签 在 输出 端口 被 去 除 ， 因 为 其 仅 用 于 交换 机 内 部 来 
跨越 总 线 。 如 果 多 个 分 组 同时 到 达 路 由 器 ， 每 个 位 于 不 同 的 输出 端口 ， 除 了 一 个 
分 组 外 所 有 其 他 分 组 必须 等 待 ， 因 为 一 次 只 有 一 个 分 组 能 够 跨越 总 线 。 因 为 每 个 
分 组 必须 跨 过 单一 总 线 ， 故 路 由 器 的 交换 带宽 受 总 线 速率 的 限制 ; 在 环 状 交 叉 路 
的 类 比 中 ， 这 相当 于 环 状 交叉 路 一 次 仅 包 含 一 辆 汽车 。 尽 管 如 此 ， 对 于 运行 在 小 
型 局 域 网 和 企业 网 中 的 路 由 器 来 说 ， 通 过 总 线 交 换 通常 足够 用 了 。Cisco 6500 路 由 
a [Cisco 6500 2016] 内 部 通过 一 个 32Gbps 背 板 总 线 来 交换 分 组 。 
经 互联 网 络 交换 。 克 服 单一 、 共 享 式 总 线 带宽 限制 的 一 种 方法 是 ， 使 用 一 个 更 复 
杂 的 互联 网 络 ， 例 如 过 去 在 多 处 理 右 计算 机 体系 结构 中 用 来 互联 多 个 处 理 狗 的 网 
络 。 纵 横 式 交换 机 就 是 一 种 由 2N 条 总 线 组 成 的 互联 网 络 ， 它 连接 N 个 输入 端口 
GON 个 输出 端口 ， 如 图 4-6 所 示 。 每 条 垂直 的 总 线 在 交叉 点 与 每 条 水 平 的 总 线 交 
叉 ， 交 叉 点 通过 交换 结构 控制 器 〈 其 逻辑 是 交换 结构 自身 的 一 部 分 ) 能 够 在 任何 
时 候 开 启 和 闭合 。 当 某 分 组 到 达 端 口 A， 需 要 转发 到 端口 YY 时， 交换 机 控制 句 闭 
合 总 线 A 和 YY 交叉 部 位 的 交叉 点 ， 然 后 端口 A 在 其 总 线 上 发 送 该 分 组 ,该 分 组 仅 
由 总 线 了 接收。 注意 到 来 自 端口 B 的 一 个 分 组 在 同一 时 间 能 够 转发 到 端口 X， 因 
为 A 到 Y 和 B 到 X 的 分 组 使 用 不 同 的 输入 和 输出 总 线 。 因 此 ， 与 前 面 两 种 交换 方 
法 不 同 ， 纵 横 式 网 络 能 够 并 行 转发 多 个 分 组 。 纵 横 式 交换 机 是 非 阻 塞 的 〈non- 
blocking) ， 即 只 要 没有 其 他 分 组 当前 被 转发 到 该 输出 端口 ， 转 发 到 输出 端口 的 分 
组 将 不 会 被 到 达 输 出 端口 的 分 组 阻塞 。 然 而， 如 果 来 自 两 个 不 同 输入 端口 的 两 个 
分 组 其 目的 地 为 相同 的 输出 端口 ， 则 一 个 分 组 必须 在 输入 端 等 每 ， 因 为 在 某 个 时 
刻 经 给 定 总 线 仅 能 够 发 送 一 个 分 组 。Cisco 12000 系列 交换 机 [Cisco 12000 2016 | 
使 用 了 一 个 互联 网 络 ; Cisco 7600 系列 能 被 配置 为 使 用 总 线 或 者 纵横 式 交 换 机 
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| Cisco 7600 2016 | 。 

更 为 复杂 的 互联 网 络 使 用 多 级 交换 元 素 ， 以 使 来 自 不 同 输入 端口 的 分 组 通过 
交换 结构 同时 朝 着 相同 的 输出 端口 前 行 。 对 交换 机 体系 结构 的 展望 可 参见 
[ Tobagi 1990], Cisco CRS 利用 了 一 种 三 级 非 阻塞 交换 策略 。 路 由 器 的 交换 能 力也 
能 够 通过 并 行 运行 多 种 交换 结构 进行 扩展 。 在 这 种 方法 中 ， 输 入 端口 和 输出 端口 
被 连接 到 并 行 运行 的 N 个 交换 结构 。 一 个 输入 端口 将 一 个 分 组 分 成 天 个 较 小 的 块 ， 
并 且 通 过 N 个 交换 结构 中 的 天 个 发 送 CME”) 这 些 块 到 所 选择 的 输出 端口 ， 输 
出 交口 再 将 天 个 块 装配 还 原 成 初始 的 分 组 。 


4.2.3 输出 端口 处 理 


如 图 4-7 中 所 示 ， 输 出 病 口 处 理 取出 已 经 存放 在 输出 端口 内 存 中 的 分 组 并 将 其 发 送 到 
输出 链 路 上 。 这 包括 选择 和 取出 排队 的 


分 组 进行 传输 ， 执 行 所 需 的 链 路 层 和 物 ron 排队 = de ik ae 


4.2.4 何 处 出 现 排队 


如 果 我 们 考虑 显示 在 图 4-6 中 的 输 
入 和 输出 端口 功能 及 其 配置 ， 下 列 情况 是 一 目 了 然 的 : 在 输入 端口 和 输出 端口 处 都 可 以 形 
成 分 组 队列 ， 就 像 在 环 状 交 叉 路 的 类 比 中 我 们 讨论 过 的 情况 ， 即 汽车 可 能 等 待 在 流量 交叉 
点 的 和 人口 和 出 口 。 排 队 的 位 置 和 程度 〈 或 者 在 输入 端口 排队 ， 或 者 在 输出 端口 排队 ) 将 取 
决 于 流量 负载 、 交 换 结 构 的 相对 速率 和 线路 速率 。 我 们 现在 更 为 详细 一 点 考虑 这 些 队列 ， 
因为 随 着 这 些 队列 的 增长 ， 路 由 需 的 缓存 空间 最 终 将 会 耗 尽 ， 并 且 当 无 内 存 可 用 于 存储 到 
达 的 分 组 时 将 会 出 现 丢 包 (packet loss) 。 回 想 前 面 的 讨论 ， 我 们 说 过 分 组 “在 网 络 中 丢 
失 ” 或 “被 路 由 髓 丢弃 ”。 正 是 在 一 台 路 由 器 的 这 些 队 列 中 ,这 些 分 组 被 实际 丢弃 或 
Éko 

假定 输入 线路 速度 与 输出 线路 速度 〈 传 输 速 率 ) 是 相同 的 ， 均 为 Rine (单位 为 每 秘 
分 组 数 ) ， 并 且 有 NAMA mAAR N 个 输出 问 口 。 为 进一步 简化 讨论 ， 假 设 所 有 分 组 具 
有 相同 的 固定 长 度 ， 分 组 以 同步 的 方式 到 达 输 入 端口 。 这 就 是 说 ， 在 任何 链 路 发 送 分 组 
的 时 间 等 于 在 任何 链 路 接收 分 组 的 时 间 ， 在 这 样 的 时 间 间 隔 内 ， 在 一 个 输入 链 路 上 能 够 
到 达 0 个 或 1 个 分 组 。 定 义 交 换 结构 传送 速率 Ri 为 从 输入 端口 到 输出 端口 能 够 移动 
分 组 的 速率 。 如 果 Roin tE Ri. 快 NN 倍 ， 则 在 输入 端口 处 仅 会 出 现 微不足道 的 排队 。 这 
是 因为 即使 在 最 坏 情况 下 ， 所 有 N 条 输入 线路 都 在 接收 分 组 ， 并 且 所 有 的 分 组 将 被 转发 
到 相同 的 输出 端口 ， 每 批 个 分 组 (每 个 输入 端口 一 个 分 组 ) 也 能 够 在 下 一 批 到 达 前 
通过 交换 结构 处 理 完毕 。 

1. 输入 排队 

如 果 交 换 结构 不 能 快 得 (相对 于 输入 线路 速度 而 言 ) 使 所 有 到 达 分 组 无 时 延 地 通过 它 
传送 ， 会 发 生 什么 情况 呢 ? 在 这 种 情况 下 ， 在 输入 端口 也 将 出 现 分 组 排队 ， 因 为 到 达 的 分 
组 必须 加 入 输入 端口 队列 中 ， 以 等 待 通过 交换 结构 传送 到 输出 端口 。 为 了 举例 说 明 这 种 排 
队 的 重要 后 果 ， 考 虑 纵横 式 交 换 结构 ， 并 假定 : (D 所 有 链 路 速度 相同 ; 已 一 个 分 组 能 够 以 
一 条 输入 链 路 接收 一 个 分 组 所 用 的 相同 的 时 间 量 ， 从 任意 一 个 输入 端口 传送 到 给 定 的 输出 


图 4-7 输出 闯 口 处 理 
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端口 ; OHI FCFS 方式 ， 从 一 指定 输入 队列 移动 到 其 要 求 的 输出 队列 中 。 只 要 其 输出 
端口 不 同 ， 多 个 分 组 可 以 被 并 行 传送 。 然 而 ， 如 果 位 于 两 个 输入 队列 前 端的 两 个 分 组 是 发 
往 同 一 输出 队列 的 ， 则 其 中 的 一 个 分 组 将 被 阻塞 ， 且 必须 在 输入 队列 中 等 待 ， 因 为 交换 续 
构 一 次 只 能 传送 一 个 分 组 到 某 指定 端口 。 

图 4-8 显示 了 一 个 例子 ， 其 中 在 输入 队列 前 闯 的 两 个 分 组 〈 融 深 色 阴 影 ) 要 发 往 同 一 
个 右上 角 输 出 端口 。 假 定 该 交换 结构 决 
定 发 送 左 上 角 队 列 前 端的 分 组 。 在 这 种 
情况 下 ,， 左 下角 队列 中 的 深 色 阴 影 分 组 
必须 等 待 。 但 不 仅 该 分 组 要 等 待 ， 左 下 
角 队 列 中 排 在 该 分 组 后 面 的 浅 色 阴影 分 
组 也 要 等 待 ， 即 使 右 中 侧 输出 端口 〈 浅 
色 阴 影 分 组 的 目的 地 ) 中 无 竞争。 这 种 


在 时 刻 ! 的 输出 端口 竞争 一 一 能 传输 一 个 深 色 阴影 分 组 





浅 色 阴 影 分 组 经 受 了 HOL 阻 塞 
现象 叫 作 输 入 排队 交换 机 中 的 线路 前 部 。_ 生生 于 ] EY 


( Head-Of-the-Line, HOL) 阻塞 ， 即 在 一 
个 输入 队列 中 排队 的 分 组 必须 等 待 通过 一口 L_ U sen L JOR 
交换 结构 发 送 ( 即使 输出 端口 是 空闲 | 


的 ) ， 因 为 它 被 位 于 线路 前 部 的 另 一 个 分 “一 口 L_ [NL Jo— 
lng gel ae aT Tee TT eT eT 
HOL 阻 塞 ， 只 要 输入 链 路 上 的 分 组 到 达 MAMO MMR MBRO 


速率 达到 其 容量 的 58% ， 在 某 些 假设 前 
提 下 ， 输 入 队列 长 度 就 将 无 限制 地 增 大 
(不 严格 地 讲 ， 这 等 同 于 说 将 出 现 大 量 的 丢 包 ) 。[ McKeown 1997b] 讨论 了 多 种 解决 HOL 
阻塞 的 方法 。 

2. 输出 排队 

我 们 接 下 来 考虑 在 交换 机 的 输出 端口 是 否 会 出 现 排队 。 再 次 假定 Ri LE Rin tR N f, 
FEAA N 个 输入 端口 的 每 个 端口 的 分 组 ， 其 目的 地 是 相同 的 输出 端口 。 在 这 种 情况 下 ， 
在 向 输出 链 路 发 送 一 个 分 组 的 时 间 内 ， 将 有 N 个 新 分 组 到 达 该 输出 端口 (N 个 输入 端口 的 
每 个 都 到 达 1 个 ) 。 因 为 输出 端口 在 一 个 单位 时 间 (该 分 组 的 传输 时 间 ) 内 仅 能 传输 一 个 
分 组 ， 这 六 个 到 达 分 组 必须 排队 (FIF) 经 输出 链 路 传输 。 在 正好 传输 入 个 分 组 (这些 
分 组 是 前 面 正在 排队 的 ) 之 一 的 时 间 中 ， 可 能 又 到 达 V 个 分 组 ， 等 等 。 所 以 ， 分 组 队列 能 
够 在 输出 端口 形成 ， 即 使 交换 结构 比 端口 线路 速率 快 N 倍 。 最 终 ， 排 队 的 分 组 数量 能 够 变 
得 足够 大 ， 耗 尽 输出 端口 的 可 用 内 存 。 

当 没 有 足够 的 内 存 来 缓存 一 个 人 分 组 时 ， 就 必须 做 出 决定 : 要 么 丢弃 到 达 的 分 组 (K 
用 一 种 称 为 弃 尾 ( drop-tail) 的 策略 ) ， 要 么 删除 一 个 或 多 个 已 排队 的 分 组 为 新 来 的 分 组 腾 
出 空间 。 在 某 些 情况 下 ， 在 缓存 填 满 之 前 便 丢 弃 一 个 分 组 (或 在 其 首部 加 上 标记 ) 的 做 法 
是 有 利 的 ， 这 可 以 疝 发 送 方 提供 一 个 拥塞 信号 。 已 经 提出 和 分 析 了 许多 分 组 丢弃 与 标记 策 
WW [Labrador 1999, Hollot 2002], ， 这 些 策 略 统 称 为 主动 队列 管理 (Active Queue Manage- 
ment, AQM) 算法 。 随 机 早期 检测 (Random Early Detection, RED) 算法 是 得 到 最 广泛 人 研 
究 和 实现 的 AQM 算法 之 一 [Christiansen 2001; Floyd 2016 | 。 


图 4-8 在 一 个 输入 排队 交换 机 中 的 HOL 阻塞 
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在 图 4-9 中 图 示 了 输出 端口 的 排队 情况 。 在 时 刻 上， 每 个 人 端 输 入 端口 都 到 达 了 一 个 
分 组 ， 每 个 分 组 都 是 发 往 最 上 侧 的 输出 端 在 时 刻 ! 的 输出 端口 竞争 
口 。 假 定 线路 速度 相同 ， 交 换 机 以 3 F aS oe IT s 
线路 速度 的 速度 运行 ， 一 个 时 间 单 位 〈 即 
接收 或 发 送 一 个 分 组 所 需 的 时 间 ) 以 后 ， 
所 有 三 个 初始 分 组 都 被 传送 到 输出 端口 ， 
并 排队 等 竺 传输。 在 下 一 个 时 间 单 位 中 ， 
这 三 个 分 组 中 的 一 个 将 通过 输出 链 路 发 送 
出 去 。 在 这 个 例子 中 ， 又 有 两 个 新 分 组 已 
到 达 交 换 机 的 和 人 疹 ; 这 些 分 组 之 一 要 发 往 
最 上 侧 的 输出 端口 。 这 样 的 后 果 是 ， 输 出 
端口 的 分 组 调度 (packet scheduler) 在 这 
些 排 队 分 组 中 选择 一 个 分 组 来 传输 ， 这 就 
是 我 们 将 在 下 节 中 讨论 的 主题 。 A 

假定 需要 路 由 需 缓 存 来 吸收 流量 负载 的 波动 ， 一 个 自然 而 然 的 问题 就 是 需要 多 少 组 
存 。 多 年 以 来 ， 用 于 缓存 长 度 的 经 验方 法 是 [RFC 3439], RAE (B) 应 当 等 于 平 
均 往 返 时 延 (RTT， 比 如 说 250ms) 乘 以 链 路 的 容量 (C) 。 这 个 结果 是 基于 相对 少量 的 
TCP 流 的 排队 动态 性 分 析 得 到 的 | Villamizar 1994], Ak, —#HAA 250ms RTT 的 
10Cbps 链 路 需要 的 缓存 量 等 于 B=RIT.' C=2.5Gb。 然 而 ,最 近 的 理论 和 试验 人 研究 
| Appenzeller 2004] H, AKEH TCP Hi (NZ) 流 过 一 条 链 路 时 ,缓存 所 需要 的 数 
量 是 B=RTT . C/VN。 对 于 通常 有 大 量 流 经 过 的 大 型 主干 路 由 器 链 路 (参见 如 [Fraleigh 
2003]), N 的 值 可 能 非常 大 ， 所 需 的 缓存 长 度 的 减 小 相当 明显 。 [Appenzeller 2004; Wis- 
chik 2005; Beheshti 2008] 从 理论 、 实 现 和 运行 的 角度 提供 了 可 读 性 很 强 的 有 关 缓 存 长 度 
问题 的 讨论 。 


4. 2.5 分 组 调度 


现在 我 们 转 而 讨论 确定 次 序 的 问题 ， 即 排队 的 分 组 如 何 经 输出 链 路 传输 的 问题 。 以 前 
你 自己 无 疑 在 许多 场合 都 排 长 队 等 待 过 ， 并 观察 过 等 待 的 客户 怎样 被 服务 ， 你 无 疑 也 熟悉 
路 由 器 中 常用 的 许多 排队 规则 。 有 一 种 是 先 来 先 服务 (FCFS， 也 称 之 为 先进 先 出 
(FIFO) ) 。 这 是 英国 人 人 共 知 的 规则 ， 用 于 病人 就 诊 、 公 交 车 站 和 市 场 中 的 有 序 FCFS BA 
列 。( 哦 ， 你 排队 了 吗 ?) 有 些 国家 基于 优先 权 运 转 ， 即 给 一 类 等 待 客户 超越 其 他 等 待 客户 
的 优先 权 服务 。 也 有 循环 排队 ， 其 中 客户 也 被 划分 为 类 别 〈 与 在 优先 权 队 列 一 样 ) ， 但 每 






类 用 户 依次 序 提供 服务 。 队列 
i ( 等 待 区 域 ) 
1. 先进 先 出 到 达 -下 
图 4-10 显示 了 对 于 先进 先 出 ( First- 
In-First- Out, FIFO) 链 路 调度 规则 的 排 链 路 
队 模 型 的 抽象 。 如 果 链 路 当前 正 忙 于 传 ( 服务 器 ) 


组 要 排队 等 竺 传输。 如 果 没 有 足够 的 组 
存 空间 来 容纳 到 达 的 分 组 ， 队 列 的 分 组 丢弃 策略 则 确定 该 分 组 是 否 将 被 丢弃 (丢失 ) 或 者 
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从 队列 中 去 除 其 他 分 组 以 便 为 到 达 的 分 组 腾 出 空间 ， 如 前 所 述 。 在 下 面 的 讨论 中 ， 我们 将 
忽视 分 组 丢弃 。 当 一 个 分 组 通过 输出 链 路 完全 传输 (也 就 是 接收 服务 ) 时 ， 从 队列 中 去 

FIFO (也 称 为 先 来 先 服 务 ，FCFS) 调度 规则 按照 分 组 到 达 输 出 链 路 队列 的 相同 次 序 
来 选择 分 组 在 链 路 上 传输 。 我 们 都 很 熟悉 服务 中 心 的 FIFO 排队 ， 在 那里 到 达 的 顾客 加 入 
单一 等 待 队 列 的 最 后 ， 保 持 次 序 ， 然 后 当 他 们 到 达 队 伍 的 前 面 时 就 接受 服务 。 

图 4-11 显示 了 运行 中 的 FIFO 队列 。 分 组 的 到 达 由 上 部 时 间 线 上 带 编号 的 箭头 来 指 
示 ， 用 编号 指示 了 分 组 到 达 的 次 序 。 各 个 分 组 的 离开 表示 在 下 部 时 间 线 的 下 面 。 分 组 在 服 
务 中 (被 传输 ) 花费 的 时 间 是 通过 这 两 个 时 间 线 之 间 的 阴影 矩形 来 指示 的 。 假 定 在 这 个 例 
子 中 传输 每 个 分 组 用 去 3 个 单位 时 间 。 利 用 FIFO 规则 ， 分 组 按照 到 达 的 相同 次 序 离开 。 
注意 在 分 组 4 离开 之 后 ， 在 分 组 5 到 达 之 前 链 路 保持 空闲 〈 因 为 分 组 1 ~4 已 经 被 传输 并 
从 队列 中 去 除 )。 





Ee he 人 4 Fs 
到 达 
I ees E. E EE SE 时 间 
服务 中 的 分 组 Ga Eco OEE i 
_ ta0 t=2 t=4 t=6 t=8 ¢=10 #1=12 1=14 时 间 
离开 
t 4 
es Bs Ey 4 5 
图 4-11 运行 中 的 FIFO 队列 
2. 优先 权 排 队 


在 优先 权 排 队 (priority queuing) 规则 下 ， 到 达 输 出 链 路 的 分 组 被 分 类 放 入 输出 
队列 中 的 优先 权 类 ， 如 图 4-12 所 示 。 在 实践 中 ， 网 络 操作 员 可 以 配置 一 个 队列 ， 这 
样 携带 网 络 管理 信息 的 分 组 (例如 ， 由 源 或 目的 TCPZUDP 端口 号 所 标识 ) 获得 超过 
用 户 流量 的 优先 权 ; 此 外 ， 基 于 IP 的 实 高 优先 权 队 列 ( 等 待 区 ) 

时 话音 分 组 可 能 获得 超过 非 实时 流量 
(如 SMTP 或 IMAP 电子 邮件 分 组 ) 的 优 
先 权 。 每 个 优先 权 类 通常 都 有 自己 的 队 
列 。 当 选择 一 个 分 组 传输 时 ， 优 先 权 排 分 类 链 路 ( 服务 器 ) 
队 规 则 将 从 队列 为 非 空 (也 就 是 有 分 组 低 优先 权 队列 ( 等 待 区 ) 

等 待 传输 ) 的 最 高 优先 权 类 中 传输 一 个 图 4-12 ”优先 权 排 队 模型 

分 组 。 在 同一 优先 权 类 的 分 组 之 间 的 选 

择 通 常 以 FIFO 方式 完成 。 

图 4-13 描述 了 有 两 个 优先 权 类 的 一 个 优先 权 队 列 的 操作 。 分 组 1、3 和 4 属于 高 
优先 权 类 ， 分 组 2 和 5 属于 低 优先 权 类 。 分 组 1 到 达 并 发 现 链 路 是 空闲 的 ， 就 开始 传 
输 。 在 分 组 1 的 传输 过 程 中 ,分 组 2 和 3 到 达 ， 并 分 别 在 低 优先 权 和 高 优先 权 队 列 中 
排队 。 在 传输 完 分 组 1 后 ， 分 组 3 (一 个 高 优先 权 的 分 组 ) 被 选择 在 分 组 2 (尽管 它 
到 达 得 较 早 ， 但 它 是 一 个 低 优先 权 分 组 ) 之 前 传输 。 在 分 组 3 的 传输 结束 后 ， 分 组 2 
开始 传输 。 分 组 4 (一 个 高 优先 权 分 组 ) 在 分 组 2 (一 个 低 优先 权 分 组 ) 的 传输 过 程 
中 到 达 。 在 非 抢 占 式 优先 权 排队 (non-preemptive priority queuing) 规则 下 ,一旦 分 组 
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开始 传输 ， 就 不 能 打 断 。 在 这 种 情况 下 ， 分 组 4 排队 等 竺 传输， 并 在 分 组 2 传输 完成 
之 后 开始 传输 。 


SP 2 EF E 5 
到 达 





时 间 
RShHoa Foo Tsay 2 f=. iii 5 





t=0 t=2 t=4 t=6 tamg t=10 t=12 t= 14 


图 4-13 优先 权 队 列 的 操作 


3. 循环 和 加 权 公 平 排队 

在 循环 排队 规则 (round robin queuing discipline) 下 ,分 组 像 使 用 优先 权 排 队 那 样 被 
分 类 。 然 而 ， 在 类 之 间 不 存在 严格 的 服务 优先 权 ， 循 环 调度 器 在 这 些 类 之 间 轮 流 提供 服 
务 。 在 最 简单 形式 的 循环 调度 中 ， 类 1 的 分 组 被 传输 ， 接 着 是 类 2 的 分 组 ， 接 着 又 是 类 1 
的 分 组 ， 再 接着 又 是 类 2 的 分 组 ， 等 等 。 一 个 所 谓 的 保持 工作 排队 (work- conserving queu- 
ing) 规则 在 有 (任何 类 的 ) 分 组 排队 等 待 传输 时 ， 不 允许 链 路 保持 空闲 。 当 寻找 给 定 类 
的 分 组 但 是 没有 找到 时 ， 保 持 工作 的 循环 规则 将 立即 检查 循环 序列 中 的 下 一 个 类 。 

图 4-14 描述 了 一 个 两 类 循环 队列 的 操作 。 在 这 个 例子 中 ,分 组 1、2 和 4 属于 第 一 类 ， 
分 组 3 和 5 属于 第 二 类 。 分 组 1 一 到 达 输 出 队列 就 立即 开始 传输 。 分 组 2 和 3 在 分 组 1 的 
传输 过 程 中 到 达 ， 因 此 排队 等 竺 传输。 在 分 组 1 传输 后 ， 链 路 调度 器 查找 类 2 的 分 组 ， 因 
此 传输 分 组 3。 在 分 组 3 传输 完成 后 ， 调 度 需 查找 类 1 的 分 组 ， 因 此 传输 分 组 2。 在 分 组 2 
传输 完成 后 ， 分 组 4 是 唯一 排队 的 分 组 ， 因 此 在 分 组 2 后 立刻 传输 分 组 4。 
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图 4-14 两 类 循环 队列 的 操作 

一 种 通用 形式 的 循环 排队 已 经 广泛 地 实现 在 路 由 右 中 ， 它 就 是 所 谓 的 加 权 公 平 排队 
( Weighted Fair Queuing, WFQ) 规 则 
| Demers 1990; Parekh 1993; Cisco QoS 
2016]. FA 4-15 对 WFQ 进行 了 描述 。 其 
中 ， 到 达 的 分 组 被 分 类 并 在 合适 的 每 个 
类 的 等 待 区 域 排队 。 与 使 用 循环 调度 一 
FE, WFQ 调度 器 也 以 循环 的 方式 为 各 个 
类 提供 服务 ， 即 首先 服务 第 1 类 ， 然 后 
服务 第 2 类 ， 接 着 再 服务 第 3 类 ， 然 后 RTS, es 





(假设 有 3 个 类 别 ) 重复 这 种 服务 模式 。WFQ 也 是 一 种 保持 工作 排队 规则 ， 因 此 在 发 现 一 
个 空 的 类 队列 时 ， 它 立即 移 向 服务 序列 中 的 下 一 个 类 。 

WFQ 和 循环 排队 的 不 同 之 处 在 于 ， 每 个 类 在 任何 时 间 间 隔 内 可 能 收 到 不 同 数量 的 服 
务 。 具 体 而 言 ， 每 个 类 i 被 分 配 一 个 权 w;。 使 用 WFQ 方式 ， 在 类 i 有 分 组 要 发 送 的 任何 时 
[ea] fia) Brag, B i 类 将 确保 接收 到 的 服务 部 分 等 于 w 了 w)， 式 中 分 母 中 的 和 是 计算 所 有 
有 分 组 排队 等 待 传输 的 类 别 得 到 的 。 在 最 坏 的 情况 下 ， 即 使 所 有 的 类 都 有 分 组 排队 ,第 i 
类 仍然 保证 分 配 到 带宽 的 w/( Ew) 部 分 。 因 此 ， 对 于 一 条 传输 速率 为 R 的 链 路 ,第 i 类 
总 能 获得 至 少 为 Rw/( Zw) 的 吞吐 量 。 我 们 对 WFQ 的 描述 理想 化 了 ， 因 为 没有 考虑 
这 样 的 事实 : 分 组 是 离散 的 数据 单元 ， 并 且 不 能 打 断 一 个 分 组 的 传输 来 开始 传输 另 一 个 分 
组 ; [Demers 1990; Parekh 1993] 讨论 了 这 个 分 组 化 问题 。 


4.3 网 际 协议 : IPv4、 寻 址 、IPv6 及 其 他 


到 目前 为 止 ， 我 们 在 第 4 章 中 对 网 络 层 的 学 习 ， 包 括 网 络 层 的 数据 平面 和 控制 平面 组 
件 概 念 ， 转 发 和 路 由 选择 之 间 的 区 别 ， 各 种 网 络 服务 模型 的 标识 和 对 路 由 器 内 部 的 观察 ， 
并 未 提 及 任何 特定 的 计算 机 网 络 体系 结构 或 协议 。 在 这 节 中 ， 我 们 将 关注 点 转向 今天 的 因 
特 网 网 络 层 的 关键 方面 和 著名 的 网 际 协议 CIP) 。 

今天 有 两 个 版 本 的 卫 正 在 使 用 。 在 4.3.1 节 中 ,我 们 首先 研究 广泛 部 署 的 IP 版 本 4， 
这 通常 简单 地 称 为 IPv4 [ RFC 791]。 在 4.3.5 节 中 ,我 们 将 仔细 考察 IP 版 本 6 [RFC 
2460; RFC 4291 ] ， 它 已 经 被 提议 替代 IPv4。 在 中 间 ， 我 们 将 主要 学 习 因 特 网 编 址 ， 这 是 
一 个 看 起 来 相当 枯燥 和 面向 细节 的 主题 ， 但 是 这 对 理解 因特网 网 络 层 如 何 工作 是 至 关 重 要 
的 。 掌 握 IP 编 址 就 是 掌握 因特网 的 网 络 层 ! 


4. 3.1 IPv4 数据 报 格式 32 比 特 
前 面 讲 过 网 络 层 分 组 被 称 为 数据 报 。 版本” 长庚 ”服务 类 型 。 。 数据 报 长 度 ( 字 池 ) 

我 们 以 概述 IPv4 数据 报 的 语法 和 语义 开 16 比 特 标识 标志 “13 比 特 片 偏 移 

始 对 公 的 学 习 。 你 也 许 认为 没有 什么 比 。” 考 h E ag 

一 个 分 组 的 比特 的 语法 和 语义 更 加 枯燥 无 = | 

味 的 了 。 无 论 如何 ， 数 据 报 在 因特网 中 起 er Re al ATE 

着 重要 作用 ， 每 个 网 络 行业 的 学 生 和 专业 32 比 特 目 的 于 地 址 

人 员 都 需要 理解 它 、 吸 收 它 并 掌握 它 (只 EI (如果 有 的 话 ) 


是 理解 协议 首部 的 确 能 够 使 学 习 成 为 有 趣 
的 事 ， 请 查阅 | Pomeranz 2010 ] ) IPv4 
数据 报 格式 如 图 4-16 所 示 。 图 4-16 IPv4 数据 报 格式 
IPv4 数据 报 中 的 关键 字段 如 下 : 
© 版 本 (号 )。 这 4 比特 规定 了 数据 报 的 IP 协议 版 本 。 通 过 查看 版 本 号 ， 路 由 器 能 
够 确定 如 何 解释 IP 数据 报 的 剩余 部 分 。 不 同 的 IP 版 本 使 用 不 同 的 数据 报 格式 。 
IPv4 的 数据 报 格式 如 图 4-16 所 示 。 新 版 本 的 IP (IPv6) 的 数据 报 格式 将 在 4. 3.5 
节 中 讨论 。 
e 首部 长 度 。 因 为 一 个 IPv4 数据 报 可 包含 一 些 可 变数 量 的 选项 (这 些 选 项 包括 在 
IPv4 数据 报 首部 中 ) ， 故 需要 用 这 4 比特 来 确定 IP 数据 报 中 载荷 〈 例 如 在 这 个 数 


数据 
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据 报 中 被 封装 的 运输 层 报 文 段 ) 实际 开始 的 地 方 。 大 多 数 IP 数据 报 不 包含 选项 ， 
所 以 一 般 的 IP 数据 报 具 有 20 字 节 的 首部 。 

服务 类 型 。 服 务 类 型 (TOS) 比特 包含 在 IPv4 首部 中 ， 以 便 使 不 同类 型 的 IP A 
据 报 〈 例 如， 一 些 特别 要 求 低 时 延 、 高 吞吐 量 或 可 靠 性 的 数据 报 ) 能 相互 区 别 
开 来 。 例 如 ， 将 实时 数据 报 (如 用 于 IP 电话 应 用 ) 与 非 实 时 流量 (如 FTP) 区 
分 开 也 许 是 有 用 的 。 提 供 特 定 等 级 的 服务 是 一 个 由 网 络 管理 员 对 路 由 器 确定 和 
配置 的 策略 问题 。 我 们 在 3.7. 2 节 讨 论 明 确 拥 塞 通告 所 使 用 的 两 个 TOS 比特 时 
也 学 习 过 。 

数据 报 长 度 。 这 是 下 数 据 报 的 总 长 度 (首部 加 上 数据 ) ， 以 字 节 计 。 因 为 该 字 
段 长 为 16 比特 ， 所 以 IP 数据 报 的 理论 最 大 长 度 为 65 535 字 节 。 然 而 ， 数 据 报 
很 少 有 超过 1500 字 节 的 ， 该 长 度 使 得 IP 数据 报 能 容纳 最 大 长 度 以 太 网 帧 的 载 
tnt BE. 

标识 、 标 志 、 片 偏 移 。 这 三 个 字段 与 所 谓 P 分 片 有 关 ， 这 是 一 个 我 们 将 很 快要 考 
虑 的 主题 。 有 趣 的 是 ， 新 版 本 的 人 (BIIP) 不 允许 在 路 由 器 上 对 分 组 分 片 。 
寿命 。 寿 命 (Time-To-Live, TTL) 字段 用 来 确保 数据 报 不 会 永远 ( 如 由 于 长 时 间 
的 路 由 选择 环 路 ) 在 网 络 中 循环 。 每 当 一 台 路 由 器 处 理 数据 报时 ， 该 字段 的 值 减 
1。 若 TTL 字 上段 减 为 0， 则 该 数据 报 必须 丢弃 。 

协议 。 该 字段 通常 仅 当 一 个 IP 数据 报到 达 其 最 终 目 的 地 时 才 会 有 用 。 该 字段 值 
指示 了 IP 数据 报 的 数据 部 分 应 交 给 哪个 特定 的 运输 层 协议 。 例 如 ， 值 为 6 表明 
数据 部 分 要 交 给 TCP， 而 值 为 17 表明 数据 要 交 给 UDP。 对 于 所 有 可 能 值 的 列 
K, ARL | IANA Protocol Numbers 2016 | 。 注 意 在 IP 数据 报 中 的 协议 号 所 起 的 作 
用 ， 类 似 于 运输 层 报 文 段 中 端口 号 字段 所 起 的 作用 。 协 议 号 是 将 网 络 层 与 运输 
层 绑 定 到 一 起 的 黏合 剂 ， 而 端口 号 是 将 运输 层 和 应 用 层 绑 定 到 一 起 的 黏合 剂 。 
我 们 将 在 第 6 章 看 到 ， 链 路 层 帧 也 有 一 个 特殊 字段 用 于 将 链 路 层 与 网 络 层 绑 定 
到 一 起 。 

首部 检验 和 。 首 部 检验 和 用 于 帮助 路 由 器 检测 收 到 的 P 数据 报 中 的 比特 错误 。 首 
部 检验 和 是 这 样 计 算 的 : 将 首部 中 的 每 2 个 字 节 当 作 一 个 数 ， 用 反 码 算术 对 这 些 
数 求 和 。 如 在 3. 3 节 讨 论 的 那样 ， 该 和 的 反 码 (被 称 为 因特网 检验 和 ) 存放 在 检 
验 和 字段 中 。 路 由 需要 对 每 个 收 到 的 IP 数据 报 计算 其 首部 检验 和 ， 如 果 数 据 报 首 
部 中 携带 的 检验 和 与 计算 得 到 的 检验 和 不 一 致 ， 则 检测 出 是 个 差错 。 路 由 器 一 般 
会 丢弃 检测 出 错误 的 数据 报 。 注 意 到 在 每 台 路 由 器 上 必须 重新 计算 检验 和 并 再 次 
存放 到 原 处 ， 因 为 TTL 字 段 以 及 可 能 的 选项 字段 会 改变 。 关 于 计算 因特网 检验 和 
的 快速 算法 的 有 趣 讨 论 参 见 [RFC 1071 ] 。 此 时 ， 一 个 经 常 问 的 问题 是 : 为 什么 
TCP/IP 在 运输 层 与 网 络 层 都 执行 差错 检测 ? 这 种 重复 检测 有 几 种 原因 。 首 先 ， 注 
意 到 在 IP 层 只 对 卫 首 部 计算 了 检验 和 ， 而 TCP/ZUDP 检验 和 是 对 整个 TCPAUDP {R 
MEH TN. H, TCP/UDP 与 IP 不 一 定 都 必须 属于 同一 个 协议 栈 。 原 则 上 ， 
TCP 能 够 运行 在 一 个 不 同 的 协议 (如 ATM) 上 [Black 1995]， 而 卫 能 够 携带 不 
一 定 要 传递 给 TCP/UDP 的 数据 。 

源 和 目的 卫 地 址 。 当 某 源 生 成 一 个 数据 报时 ， 它 在 源 IP 字段 中 插入 它 的 I 地 
tt, 7EA AY IP 地 址 字段 中 插入 其 最 终 目 的 地 的 地 址 。 通 常 源 主机 通过 DNS 查找 
来 决定 目的 地 址 ， 如 在 第 2 章 中 讨论 的 那样 。 我 们 将 在 4.3.3 节 中 详细 讨论 IP 
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编 址 。 
© 选项 。 选 项 字段 允许 卫 首 部 被 扩展 。 首 部 选项 意味 着 很 少 使 用 ， 因 此 决定 对 每 个 
数据 报 首部 不 包括 选项 字段 中 的 信息 ， 这 样 能 够 节约 开销 。 然 而 ， 少 量 选 项 的 存 
在 的 确 使 问题 复杂 了 ， 因 为 数据 报 首部 长 度 可 变 ， 故 不 能 预先 确定 数据 字段 从 何 
处 开始 。 而 且 还 因为 有 些 数 据 报 要 求 处 理 选 项 ， 而 有 些 数 据 报 则 不 要 求 ， 故 导致 
一 台 路 由 器 处 理 一 个 IP 数 据 报 所 需 的 时 间 变 化 可 能 很 大 。 这 些 考虑 对 于 高 性 能 路 
由 器 和 主机 上 的 IP 处 理 来 说 特别 重要 。 由 于 这 样 或 那样 的 原因 ， 在 IPv6 首部 中 已 
去 掉 了 IP 选项， 如 4. 3.5 节 中 讨论 的 那样 。 
© 数据 (有 效 载荷 )。 我 们 来 看 看 最 后 也 是 最 重要 的 字段 ， 这 是 数据 报 存在 的 首要 理 
由 1! 在 大 多 数 情况 下 ，IP 数据 报 中 的 数据 字段 包含 要 交付 给 目的 地 的 运输 层 报 文 
Be (TCP 或 UDP)。 然 而 ， 该 数据 字段 也 可 承载 其 他 类 型 的 数据 ， 如 ICMP 报 文 
(在 5.6 节 中 讨论 ) 。 
注意 到 一 个 IP 数据 报 有 总 长 为 20 字 节 的 首部 〈 假 设 无 选项 ) 。 如 果 数 据 报 承载 一 个 
TCP 报 文 段 ， 则 每 个 〈 无 分 片 的 ) 数据 报 共 承载 了 总 长 40 字 市 的 首部 (20 FAY IP H 
部 加 上 20 字 节 的 TCP 首部 ) 以 及 应 用 层 报 文 。 


4.3.2 IPv4 数据 报 分 片 


在 第 6 章 中 我 们 将 看 到 ， 并 不 是 所 有 链 路 层 协议 都 能 承载 相同 长 度 的 网 络 层 分 组 。 有 
的 协议 能 承载 大 数据 报 ， 而 有 的 协议 只 能 承载 小 分 组 。 例 如 ， 以 太 网 帧 能 够 承载 不 超过 
1500 字 节 的 数据 ， 而 某 些 广域网 链 路 的 帧 可 承载 不 超过 576 字 节 的 数据 。 一 个 链 路 层 帧 能 
承载 的 最 大 数据 量 叫 作 最 大 传送 单元 (Maximum Transmission Unit，MTU ) 。 因 为 每 个 IP 数 
据 报 封 闻 在 链 路 层 帧 中 从 一 人 台 路 由 顺 传 输 到 下 一 台 路 由 璐 ， 故 链 路 层 协 议 的 MTU 严格 地 
限制 着 IP 数据 报 的 长 度 。 对 IP 数据 报 长 度 具 有 严格 限制 并 不 是 主要 问题 。 问 题 在 于 在 发 
送 方 与 目的 地 路 径 上 的 每 段 链 路 可 能 使 用 不 同 的 链 路 层 协 议 ， 且 每 种 协议 可 能 具有 不 同 
的 MTU. 

为 了 更 好 地 理解 这 一 转发 问题 ， 想 象 你 是 一 台 互 联 几 条 链 路 的 路 由 器 ， 且 每 条 链 路 
运行 具有 不 同 MTU 的 链 路 层 协议 。 假 定 你 从 某 条 链 路 收 到 一 个 IP 数据 报 ， 通 过 检查 转 
发 表 确 定 出 链 路 ， 并 且 该 条 出 链 路 的 MTU 比 该 卫 数 据 报 的 长 度 要 小 。 此 时 你 会 感到 惰 
乱 ， 如 何 将 这 个 过 大 的 IP 分 组 挤 进 链 路 层 帧 的 有 效 载 荷 字 段 呢 ? 解决 该 问题 的 方法 是 
将 IP 数据 报 中 的 数据 分 片 成 两 个 或 更 多 个 较 小 的 IP 数据 报 ， 用 单独 的 链 路 层 帧 封装 这 
些 较 小 的 IP 数据 报 ， 然 后 通过 输出 链 路 发 送 这 些 帧 。 每 个 这 些 较 小 的 数据 报 都 称 为 片 
( fragment ) 。 

片 在 其 到 达 目 的 地 运输 层 以 前 需要 重新 组 装 。TCP 与 UDP 的 确 都 布 望 从 网 络 层 收 
到 完整 的 、 未 分 片 的 报 文 。IPv4 的 设计 者 感到 在 路 由 器 中 重新 组 装 数据 报 会 给 协议 市 
来 相当 大 的 复杂 性 并 且 影 响 路 由 器 的 性 能 。( 如 果 你 是 一 台 路 由 器 ， 你 愿意 将 重新 组 
装 报 文 片 放 在 你 必须 要 做 的 各 种 各 样 工 作 的 首位 吗 ?) 为 坚持 网 络 内 核 保 持 简单 的 原 
则 ，IPv4 的 设计 者 决定 将 数据 报 的 重新 组 装 工 作 放 到 端 系统 中 ， 而 不 是 放 到 网 络 路 由 
ar P o 

当 一 台 目 的 主机 从 相同 源 收 到 一 系列 数据 报时 ， 它 需要 确定 这 些 数据 报 中 的 某 些 是 否 
是 一 些 原 来 较 大 的 数据 报 的 片 。 如 果 某 些 数据 报 是 这 些 片 的 话 ， 则 它 必 须 进一步 确定 何 时 
收 到 了 最 后 一 片 ， 并 且 如 何 将 这 些 接收 到 的 片 拼 接 到 一 起 以 形成 初始 的 数据 报 。 为 了 让 目 
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的 主机 执行 这 些 重 新 组 装 任务 ，IPv4 的 设计 者 将 标识 、 标 志和 片 偏 移 字段 放 在 IP 数据 报 
首部 中 。 当 生成 一 个 数据 报时 ， 发 送 主机 在 为 该 数据 报 设置 源 和 目的 地 址 的 同时 贴 上 标识 
号 。 发 送 主机 通常 将 它 发 送 的 每 个 数据 报 的 标识 号 加 1。 当 某 路 由 需 需 要 对 一 个 数据 报 分 
片 时 ， 形 成 的 每 个 数据 报 (BIA) 具有 初始 数据 报 的 源 地 址 、 目 的 地 址 与 标识 号 。 当 目的 
地 从 同一 发 送 主机 收 到 一 系列 数据 报时 ， 它 能 够 检查 数据 报 的 标识 号 以 确定 哪些 数据 报 实 
际 上 是 同一 较 大 数据 报 的 片 。 由 于 IP 是 一 种 不 可 靠 的 服务 ， 一 个 或 多 个 片 可 能 永远 到 达 
不 了 目的 地 。 因 为 这 种 原因 ， 为 了 让 目的 主机 绝对 地 相信 它 已 收 到 了 初始 数据 报 的 最 后 一 
个 片 ， 最 后 一 个 片 的 标志 比特 被 设 为 0， 而 所 有 其 他 片 的 标志 比特 被 设 为 1。 另 外， 为 了 
让 目的 主机 确定 是 否 丢 失 了 一 个 片 ( 且 能 按 正 确 的 顺序 重新 组 闭 片 )， 使 用 偏 移 字段 指定 
该 片 应 放 在 初始 IP 数据 报 的 哪个 位 置 。 

Al4-17 sd i 
4000 字 节 的 数据 报 (20 Fi IP 首部 
加 上 3980 字 节 IP 有 效 载荷 ) 到 达 一 
台 路 由 需 ， 且 必须 被 转发 到 一 条 MTU 
为 1500 字 节 的 链 路 上 。 这 就 意味 着 初 
始 数据 报 中 3980 字 市 数据 必须 被 分 配 
为 3 个 独立 的 片 (其 中 的 每 个 片 也 是 

-个 IP BAR ) 

本 书 的 在 线材 料 和 本 章 后 面 的 习 
题 将 使 你 能 够 详细 探究 分 片 。 在 本 书 
的 Web 站 点 上 ， 我 们 提供 了 一 个 Java 
小 程序 来 产生 片 。 提 供 入 数据 报 长 度 、 
MTU 和 入 数据 报 标识 ， 它 就 会 自动 为 图 4-17 IP 分 片 与 重新 组 装 
你 产生 片 。 参 见 http://www. pearsonhighered. com/cs- resources/ 。 


4.3.3 IPv4 编 址 






分 片 : 
A: 一 个 大 数据 报 ( 4000 FH ) 
出 : 3 个 较 小 数据 报 


链 路 MTU: 1500 字 节 











入 : 3 个 较 小 数据 报 
th: 一 个 大 数据 报 ( 4000 字 节 ) 


我 们 现在 将 注意 力 转向 IPv4 编 址 。 尽 管 你 可 能 认为 编 址 是 相当 直接 的 主题 ， 但 我 们 希望 
通过 本 章 的 学 习 ， 你 能 认识 到 因特网 编 址 不 仅 是 一 个 丰富 多 彩 、 微 妙 和 有 趣 的 主题 ， 而 且 也 
是 一 个 对 因特网 极为 重要 的 主题 。[ Stewart 1999] 的 第 1 章 是 介绍 IPv4 编 址 的 优秀 读物 。 

然而 ， 在 讨论 IP 编 址 之 前 ， 我 们 需要 简 述 一 下 主机 与 路 由 器 连 人 网 络 的 方法 。 一 人 台 
主机 通常 只 有 一 条 链 路 连接 到 网 络 ; 当主 机 中 的 IP 想 发 送 一 个 数据 报时 ， 它 就 在 该 链 路 
上 发 送 。 主 机 与 物理 链 路 之 间 的 边界 叫 作 接口 (interface), MEZ IE— ARH AERA 
口 。 因 为 路 由 器 的 任务 是 从 链 路 上 接收 数据 报 并 从 某 些 其 他 链 路 转发 出 去 ， 路 由 需 必 须 拥 
有 两 条 或 更 多 条 链 路 与 它 连接 。 路 由 器 与 它 的 任意 一 条 链 路 之 间 的 边界 也 叫 作 接 口 。 一 台 
路 由 器 因此 有 多 个 接口 ， 每 个 接口 有 其 链 路 。 因 为 每 台 主 机 与 路 由 器 都 能 发 送 和 接收 人 P 
数据 报 ，IP 要 求 每 台 主 机 和 路 由 费 接 口 拥有 自己 的 全 地 址 。 因 此， 从 技术 上 讲 ， — IP 
地 址 与 一 个 接口 相关 联 ， 而 不 是 与 包括 该 接口 的 主机 或 路 由 器 相关 联 。 

每 个 IP 地 址 长 度 为 32 比特 (等 价 为 4 字 节 )， 因 此 总 共有 2” 个 (或 大 约 40 亿 个 ) 
可 能 的 IP 地 址 。 这 些 地 址 通常 按 所 谓 点 分 十 进 制 记 法 ( dotted- decimal notation) 书写 ， 即 
地 址 中 的 每 个 字 节 用 它 的 十 进 制 形式 书写 ， 各 字 节 间 以 句点 隔 开 。 例 如 ， 考 虑 IP 地 址 
193. 32.216.9, 193 是 该 地 址 的 第 一 个 8 比特 的 十 进 制 等 价 数 ，32 是 该 地 址 的 第 二 个 8 比 
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特 的 十 进 制 等 价 数 ， 依 次 类 推 。 因 此 ， 地 址 193. 32. 216.9 的 二 进 制 记 法 是 : 
11000001 00100000 11011000 00001001 

在 全 球 因 特 网 中 的 每 台 主 机 和 路 由 带 上 的 每 个 接口 ， 都 必须 有 一 个 全 球 唯一 的 上 地 
HE (在 NAT 后面 的 接口 除外 ,在 4.3.4 节 中 讨论 )。 然 而 ,这 些 地 址 不 能 随意 地 自由 选 
择 。 一 个 接口 的 卫 地 址 的 一 部 分 需要 由 其 连接 的 子 网 来 决定 。 

图 4-18 提供 了 一 个 IP 编 址 与 接口 的 例子 。 在 该 图 中 ， 一 台 路 由 需 〈 具 有 3 个 接口 ) 
用 于 互联 7 台 主 机 。 仔 细 观 察 分 配给 主机 和 路 由 带 接 口 的 IP 地址， 有 几 点 需要 注意 。 
图 4-18 中 左上 侧 的 3 台 主 机 以 及 它们 连接 的 路 由 器 接口 ， 都 有 一 个 形 如 223. 1. 1. xxx AY IP 
地 址 。 这 就 是 说 ， 在 它们 的 PP 地址 中 ,最 左 侧 的 24 比特 是 相同 的 。 这 4 个 接口 也 通过 一 
个 并 不 包含 路 由 器 的 网 络 互 联 起 来 。 该 网 络 可 能 由 一 个 以 太 网 LAN 互联 ， 在 此 情况 下 ， 
这 些 接口 将 通过 一 台 以 太 网 交换 机 互联 (如 第 6 草 中 讨论 的 那样 ) ， 或 者 通过 一 个 无 线 接 
入 点 互联 (如 第 7 章 中 讨论 的 那样 ) 。 我 们 此 时 将 这 种 无 路 由 需 连 接 这 些 主 机 的 网 络 表 示 
为 一 条 云 ， 在 第 6、7 章 中 再 深入 这 些 网 络 的 内 部 。 
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r 223.1.2.2 
223.1.1.3 it 
用 IP 的 术语 来 说 ， 互 联 这 3 个 主机 接口 与 1 个 路 由 器 接口 的 网 络 形成 一 个 子 网 ( sub- 
/24 WE, AREA F AHE (network 
3 EPL (223.1.1.1, 223.1.1.2 A 
和 223.1.1.3) Ml FRASE 
有 223. 1. 1. xxx 的 形式 。 图 4-18 中 显示 了 


223.1.3.1 223.1.3.2 

net) [RFC 950] 。( 在 因特网 文献 中 ， 子 网 也 称 为 IP 网 络 或 直接 称 为 网 络 。) IP 编 址 为 这 个 
mask) ， 指 示 32 比特 中 的 最 左 侧 24 比特 

(223.1.1.4) 组 成 。 任 何其 他 要 连 到 

另外 两 个 网 络 : 223.1.2.0/24 网 络 与 


图 4-18 接口 地 址 和 子 网 
子 网 分 配 一 个 地 址 223. 1. 1. 0/24 ， 其 中 的 
昌 一 223.1.1.0/24 
223.1.2.0/24 ~ 上 E 
定义 了 子 网 地 址 。 因 此 子 网 223. 1. 1. 0/24 
加 一 | 223.1.3.0/24 
223. 1. 1. 0/24 网 络 的 主机 都 要 求 其 地 址 具 A A 
223. 1.3.0/24 子 网 。 图 4- 19 图 示 了 在 图 4-19 子 网 地 址 
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图 4-18 中 存在 的 3 个 卫 子 网 。 

一 个 子 网 的 耳 定义 并 不 局 限于 连接 多 台 主 机 到 一 个 路 由 器 接口 的 以 太 网 段 。 为 了 搞 
清 其 中 的 道理 ， 可 考虑 图 4-20， 图 中 显示 了 3 人 台 通 过 点 对 点 链 路 彼此 互联 的 路 由 器 。 每 台 
路 由 器 有 3 个 接口 ， 每 条 点 对 点 链 路 使 用 一 个 ， 一 个 用 于 直接 将 路 由 器 连接 到 一 对 主机 的 
广播 链 路 。 这 里 出 现 了 几 个 子 网 呢 ? 3 个 子 网 223. 1. 1. 0/24 、223. 1. 2. 0/24 和 223. 1. 3. 0/ 
24 类 似 于 我 们 在 图 4-18 中 过 到 的 子 网 。 但 注意 到 在 本 例 中 还 有 其 他 3 个 子 网 : 一 个 子 网 
是 223. 1.9.0/24， 用 于 连接 路 由 器 RI 与 R 的 接口 ; 另外 一 个 子 网 是 223. 1. 8. 0/24 ， 用 
于 连接 路 由 器 R2 与 R3 的 接口 ; 第 三 个 子 网 是 223. 1. 7. 0/24 ， 用 于 连接 路 由 器 R 5 RI 
的 接口 。 对 于 一 个 路 由 器 和 主机 的 通用 互联 系统 ， 我 们 能 够 使 用 下 列 有 效 方法 定义 系统 中 
的 子 网 : 

为 了 确定 子 网 ， 分 开 主 机 和 路 由 器 的 每 个 接口 ， 产 生 几 个 隔离 的 网 络 岛 ， 使 

用 接口 端 接 这 些 隔 离 的 网 络 的 端点 。 这 些 隔离 的 网 络 中 的 每 一 个 都 叫 作 一 个 子 网 

(subnet) . 
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223.1.2.1 223.1.2.2 223.1.3.1 223.1.3.2 
图 4-20 3 Get ae 6 个 子 网 


如 果 我 们 将 该 过 程 用 于 图 4-20 中 的 互联 系统 上 ， 会 得 到 6 个 岛 或 子 网 。 

从 上 述 讨 论 显 然 可 以 看 出 ， 一 个 具有 多 个 以 太 网 段 和 点 对 点 链 路 的 组 织 〈 如 一 个 公司 
或 学 术 机 构 ) 将 具有 多 个 子 网 ， 在 给 定子 网 上 的 所 有 设备 都 具有 相同 的 子 网 地 址 。 原 则 
上 ， 不 同 的 子 网 能 够 具有 完全 不 同 的 子 网 地 址 。 然 而 ， 在 实践 中 ， 它 们 的 子 网 地 址 经 常 有 
许多 共同 之 处 。 为 了 理解 其 中 的 道理 ， 我 们 来 关注 在 全 球 因 特 网 中 是 如 何 处 理 编 址 的 。 

因特网 的 地 址 分 配 策略 被 称 为 无 类 别 域 间 路 由 选择 (Classless Interdomain Routing, 
CIDR) [RFC 4632 ] 。CIDR 将 子 网 寻 址 的 概念 一 般 化 了 。 当 使 用 子 网 寻 址 时 ，32 比特 的 
IP 地 址 被 划分 为 两 部 分 ， 并 且 也 具有 点 分 十 进 制 数 形式 a. b. c. d/x， 其 中 x 指示 了 地 址 的 
第 一 部 分 中 的 比特 数 。 
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FES a. b. c. d/x 的 地 址 的 x 最 高 比特 构成 了 耳 HAZ BoP, FFAS AS OR A IK 
地 址 的 前 缀 (prefix) (或 网 络 前 缓 ) 。 一 个 组 织 通常 被 分 配 一 块 连续 的 地 址 ， 即 具有 相同 
前 级 的 一 段 地 址 (参见 “实践 原则 ”) 。 在 这 种 情况 下 ， 该 组 织 内 部 的 设备 的 IP 地 址 将 共 
享 共 同 的 前 级 。 当 我 们 在 5.4 节 中 论 及 因特网 的 BGP 路 由 选择 协议 时 ， 将 看 到 该 组 织 网 络 
外 部 的 路 由 器 仅 考虑 前 面 的 前 缀 比特 x。 这 就 是 说 ， 当 该 组 织 外 部 的 一 人 台 路 由 需 转 发 一 个 
数据 报 ， 且 该 数据 报 的 目的 地 址 位 于 该 组 织 的 内 部 时 ， 仅 需要 考虑 该 地 址 的 前 面 x 比特 。 
这 相当 大 地 减少 了 在 这 些 路 由 器 中 转发 表 的 长 度 ， 因 为 形式 为 a. b. c. d/x 的 单一 表 项 足以 
将 数据 报 转发 到 该 组 织 内 的 任何 目的 地 。 





| 这 是 一 个 ISP 将 8 个 组 织 连 接 到 因特网 的 例子 ， 它 也 很 好 地 说 明了 仔细 分 配 CIDR 
化 的 地 址 有 利于 路 由 选择 的 道理 。 如 图 4-21 所 示 ， 假设 该 ISP (我 们 称 之 为 Fly- By- 
| Night-ISP) 向 外 界 通 告 ， 它 应 该 发 送 所 有 地 址 的 前 20 比特 与 200. 23. 16. 0/20 相符 的 数 
据 报 。 外 界 的 其 他 部 分 不 需要 知道 在 地 址 块 200. 23. 16. 0/20 内 实际 上 还 存在 8 个 其 他 
组 织 ， 其 中 每 个 组 织 有 自己 的 子 网 。 这 种 使 用 单个 网 络 前 缀 通告 多 个 网 络 的 能 力 通常 称 . 
为 地 址 聚合 (address aggregation)， 也 称 为 路 由 聚合 (route aggregation) 或 路 由 摘要 


_ (route summarization ) 。 





组 织 0 
200.23,16.0/23 
“向 我 发 送 以 
33 TN 200.23.16.0/20 
组 织 2 Fly-By-Night-ISP 一 一 
2002320023 
因特网 
组 织 7 
200.23.30.0/23 “向 我 发 送 以 
199.31.0.0/16 
开始 的 任何 东西 ” 
——_— se 
— ` 
n 


图 4-21 层次 编 址 与 路 由 聚合 


当地 址 按 块 分 给 ISP， 然 后 又 由 ISP 分 给 客户 组 织 时 ， 地 址 聚合 工作 极为 有 效 。 但 
是 当地 址 不 是 按 这 样 的 层次 方式 分 配 时 ， 会 出 现 什 么 情况 呢 ? 例如 ， 如 果 Fly-By- Night- 
ISP 获取 了 ISPs-R-Us， 然 后 让 组 织 1 通过 它 辅助 的 ISPs- R-Us 与 因特网 相连 ， 将 会 发 生 
什么 情况 呢 ? 如 图 4-21 中 所 示 ， 该 辅助 的 ISPs-R-Us 拥有 地 址 块 199. 31.0.0/16, 但 很 
遗憾 的 是 组 织 1 的 IP 地 址 在 该 地 址 块 之 外 。 这 里 可 以 采取 什么 措施 呢 ? 组 织 1 ARTY 
将 其 所 有 的 路 由 器 和 主机 重新 编号 ， 使 得 地 址 在 ISPs-R- Us 的 地 址 块 内 。 但 这 是 一 种 代 
价 很 高 的 方案 ， 而 且 组 织 1 将 来 也 许 还 会 从 ISPs-R-Us 更 换 到 另 一 个 ISP。 采 用 的 典型 
方案 是 ， 组 织 1 保持 其 IP 地址 在 200. 23. 18. 0/23 内 。 在 这 种 情况 下 ， 如 图 4-22 所 示 ， 


二 
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Fly- By- Night- ISP 继续 通告 地 址 块 200. 23. 16. 0/20, # HL ISPs- R- Us 也 继续 通告 地 址 块 
199. 31. 0. 0/16。 然 而 ，ISPs-R-Us 现在 还 要 通告 组 织 1 的 地 址 块 200. 23. 18. 0/23 。 当 在 
更 大 的 因特网 上 的 其 他 路 由 器 看 见地 址 块 200. 23. 16.0/20 (来 自 Fly-By- Night-ISP) 和 
200. 23. 18. 0/23 ( % Á ISPs-R-Us), 并 且 想 路 由 选择 到 地 址 块 200. 23. 18. 0/23 内 的 一 
个 地 址 时 ， 它 们 将 使 用 最 长 前 缀 匹配 (参见 4.2.1 节 ) ， 并 朝 着 ISPs- R-Us 路 由 ， 因 为 
它 通告 了 与 目的 地 址 相 匹配 的 最 长 (MAK) 的 地 址 前 缓 。 





组 织 0 
200.23.16.0/23 
“向 我 发 送 以 
组 织 2 200.23.16.0/20 
200.23.20.0/23 ee drag AARRE 
组 织 7 —— Fly-By-Night-ISP 
200.23.30.0/23 
“向 我 发 送 以 
199.31.0.0/16 因特网 
HH I 或 200.23.18.0/23 
200,23,18.0/23— 开始 的 任何 东西 | 
一 三 ISPs-R-Us 
————- 


图 4-22 ISPs-R-Us 具有 到 组 织 1 的 一 条 更 具体 的 路 由 








一 个 地 址 的 剩余 32 -x 比特 可 认为 是 用 于 区 分 该 组 织 内 部 设备 的 ， 其 中 的 所 有 设备 具 
有 相同 的 网 络 前 缀 。 当 该 组 织 内 部 的 路 由 器 转发 分 组 时 ， 才 会 考虑 这 些 比特 。 这 些 较 低 阶 
比特 可 能 (或 可 能 不 ) 具有 另外 的 子 网 结构 ， 如 前 面 所 讨论 的 那样 。 例 如 ， 假 设 某 CIDR 
化 的 地 址 a. b. c. d/21 的 前 21 比特 定义 了 该 组 织 的 网 络 前 级 ， 它 对 该 组 织 中 所 有 主机 的 IP 
地 址 来 说 是 共同 的 。 其 余 的 11 比特 标识 了 该 组 织 内 的 主机 。 该 组 织 的 内 部 结构 可 以 采用 
这 样 的 方式 ， 使 用 最 右边 的 11 比特 在 该 组 织 中 划分 子 网 ， 就 像 前 面 所 讨论 的 那样 。 例 如 ， 
a. b. c. d/24 可 能 表示 该 组 织 内 的 特定 子 网 。 

在 CIDR 被 采用 之 前 ，IP 地址 的 网 络 部 分 被 限制 为 长 度 为 8 16 或 24 比特 ， 这 是 一 种 
称 为 分 类 编 址 (classful addressing) 的 编 址 方案 ， 这 是 因为 具有 8、16 和 24 比特 子 网 地 址 
的 子 网 分 别 被 称 为 A、B 和 C 类 网 络 。 一 个 IP 地 址 的 网 络 部 分 正好 为 1!、2 或 3 字 节 的 要 
求 ,已 经 在 支持 数量 迅速 增加 的 具有 小 规模 或 中 等 规模 子 网 的 组 织 方 面 出 现 了 问题 。 一 个 
C (/24) 子 网 仅 能 容纳 多 达 2 -2 =254 (2° =256, 其 中 的 两 个 地 址 预 留用 于 特殊 用 
R) 台 主 机 ， 这 对 于 许多 组 织 来 说 太 小 了 。 然 而 一 个 B 类 (/16) 子 网 可 支持 多 达 65 534 
台 主 机 ， 又 太 大 了 。 在 分 类 编 址 方法 下 ， 比 方 说 一 个 有 2000 台 主 机 的 组 织 通常 被 分 给 一 
ABX (/16) 地 址 。 这 就 导致 了 B 类 地 址 空间 的 迅速 损耗 以 及 所 分 配 的 地 址 空间 的 利用 
率 低下 。 例 如 ,为 具有 2000 台 主 机 的 组 织 分 配 一 个 B 类 地 址 ， 就 具有 足以 文 持 多 达 
65 534 个 接口 的 地 址 空间 ， 剩 下 的 超过 63 000 个 地 址 却 不 能 被 其 他 组 织 使 用 。 

如 果 还 不 提 及 男 一 种 类 型 的 IP 地址 ， 即 IP 广播 地 址 255. 255.255.255， 那 将 是 我 们 
的 玻 漏 。 当 一 台 主 机 发 出 一 个 目的 地 址 为 255. 255. 255. 255 的 数据 报时 ， 该 报 文 会 交付 给 
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Fe]— 4 2 PTA ENL BE at eA PH] SB AR (虽然 它们 通常 
不 这 样 做 ) 。 

现在 我 们 已 经 详细 地 学 习 了 IP 编 址 ， 需 要 知道 主机 或 子 网 最 初 是 如 何 得 到 它们 的 地 
址 的 。 我 们 先 看 一 个 组 织 是 如 何 为 其 设备 得 到 一 个 地 址 块 的， 然后 再 看 一 个 设备 〈 如 一 台 
主机 ) 是 如 何 从 某 组 织 的 地 址 块 中 分 配 到 一 个 地 址 的 。 

1. 获取 一 块 地 址 


为 了 获取 一 块 IP 地 址 用 于 一 个 组 织 的 子 网 内 ， 某 网 络 管理 员 也 许 首 先 会 与 他 的 ISP 联 
系 ， 该 ISP 可 能 会 从 已 分 给 它 的 更 大 地 址 块 中 提供 一 些 地 址 。 例 如 ， 该 ISP 也 许 目 己 已 被 
分 配 了 地 址 块 200. 23. 16. 0/20。 该 ISP 可 以 依次 将 该 地 址 块 分 成 8 个 长 度 相 等 的 连续 地 址 
块 ， 为 本 ISP 支持 的 最 多 达 8 个 组 织 中 的 一 个 分 配 这 些 地 址 块 中 的 一 块 ， 如 下 所 示 。 (为 
了 便于 查看 ， 我 们 已 将 这 些 地 址 的 网 络 部 分 加 了 了 下划线 。) 

ISP 的 地 址 块 200. 23. 16.0/20 11001000 00010111 00010000 00000000 


组 织 0 200. 23. 16. 0/23 11001000 00010111 00010000 00000000 
组 织 1 200. 23. 18. 0/23 11001000 00010111 00010010 00000000 
组 织 2 200. 23. 20. 0/23 11001000 00010111 00010100 00000000 
组 织 7 200. 23. 30. 0/23 11001000 00010111 00011110 00000000 


尽管 从 一 个 ISP 获取 一 组 地 址 是 一 种 得 到 一 块 地 址 的 方法 ,但 这 不 是 唯一 的 方法 。 显 
然 ， 必 须 还 有 一 种 方法 供 ISP 本 喘 得 到 一 块 地 址 。 是 否 有 一 个 全 球 性 的 权威 机 构 ， 它 具有 
管理 IP 地 址 空间 并 向 各 ISP 和 其 他 组 织 分 配 地 址 块 的 最 终 责 任 呢 ”的 确 有 一 个 ! IP 地 址 
由 因特网 名 字 和 编号 分 配 机 构 (Internet Corporation for Assigned Names and Numbers, 
ICANN) [ICANN 2016] 管理 ， 管 理 规则 基于 | RFC 7020 | 。 非 营利 的 ICANN 组 织 | NTIA 
1998] 的 作用 不 仅 是 分 配 IP 地 址 ， 还 管理 DNS 根 服务 器 。 它 还 有 一 项 容易 引起 争论 的 工 
作 ， 即 分 配 域名 与 解决 域名 纷争 。ICANN 向 区 域 性 因特网 注册 机 构 (如 ARIN RIPE, 
APNIC 和 LACNIC) 分 配 地 址 ， 这 些 机 构 一 起 形成 了 ICANN 的 地 址 支持 组 织 ASO- 
ICANN 2016 ] ， 处 理 本 区 域内 的 地 址 分 配 / 管 理 。 

2. 获取 主机 地 址 : 动态 主机 配置 协议 

某 组 织 一 旦 获得 了 一 块 地 址 ， 它 就 可 为 本 组 织 内 的 主机 与 路 由 需 接 口 逐 个 分 配 IP 地 
址 。 系 统管 理 员 通常 手工 配置 路 由 器 中 的 卫 地 址 (常常 在 远程 通过 网 络 管理 工具 进行 配 
置 ) 。 主 机 地 址 也 能 手动 配置 ， 但 是 这 项 任务 目前 更 多 的 是 使 用 动态 主机 配置 协议 (Dy- 
namic Host Configuration, DHCP) [RFC 2131] 来 完成 。DHCP 允许 主机 自动 获取 (被 分 
Ac) 一 个 IP 地址。 网络 管理 员 能 够 配置 DHCP， 以 使 某 给 定 主机 每 次 与 网 络 连 接 时 能 得 到 
一 个 相同 的 IP 地 址 ， 或 者 某 主机 将 被 分 配 一 个 临时 的 IP 地 址 (temporary IP address) ， 每 
次 与 网 络 连接 时 该 地 址 也 许 是 不 同 的 。 除 了 主机 IP 地 址 分 配 外 ，DHCP 还 允许 一 台 主 机 得 
知 其 他 信息 ， 例 如 它 的 子 网 掩 码 、 它 的 第 一 跳 路 由 器 地 址 ( 常 称 为 默认 网 关 ) 与 它 的 本 地 
DNS 服务 硕 的 地 址 。 

由 于 DHCP 具有 将 主机 连接 进 一 个 网 络 的 网 络 相 关 方 面 的 自动 能 力 ， 故 它 又 常 被 称 为 
即 插 即 用 协议 (plug-and-play protocol) 或 零 配置 (zeroconf) 协议 。 这 种 能 力 对 于 网 络 管 
理 员 来 说 非常 有 吸引 力 ， 否 则 他 将 不 得 不 手工 执行 这 些 任务 ! DHCP 还 广泛 地 用 于 住宅 因 特 
网 接 入 网 、 企 业 网 与 无 线 局 域 网 中 ， 其 中 的 主机 频繁 地 加 入 和 离开 网 络 。 例 如 ， 考 虑 一 个 学 
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生 带 着 便携 机 从 宿舍 到 图 书馆 再 到 教室 。 很 有 可 能 在 每 个 位 置 这 个 学 生 将 连接 到 一 个 新 的 子 
网 ， 因 此 在 每 个 位 置 都 需要 一 个 新 的 IP 地 址 。DHCP 是 适合 这 种 情形 的 理想 方法 ， 因 为 有 许 
多 用 户 来 来 往往 ， 并 且 仅 在 有 限 的 时 间 内 需要 地 址 。DHCP 的 即 插 即 用 能 力 的 价值 是 显然 的 ， 
因为 下 列 情况 是 不 可 想象 的 : 系统 管理 员 在 每 个 位 置 能 够 重新 配置 便携 机 ， 并 且 少 数学 生 
(除了 那些 上 过 计算 机 网 络 课程 的 学 生 ) 让 专家 人 工地 配置 他 们 的 便携 机 。 
DHCP 是 一 个 客户 - 服务 器 协议 。 客 户 通常 是 新 到 达 的 主机 ， 它 要 获得 包括 自身 使 用 

的 IP 地 址 在 内 的 网 络 配置 信息 。 在 最 简单 场合 下 ， 每 个 子 网 〈 在 图 4-20 的 编 址 意义 下 ) 
将 具有 一 台 DHCP 服务 器 。 如 果 在 某 子 网 中 没有 服务 器 ， 则 需要 一 个 DHCP 中 继 代理 ( 通 
常 是 一 台 路 由 器 ) ， 这 个 代理 知道 用 于 该 网 络 的 DHCP 服务 器 的 地 址 。 图 4-23 显示 了 连接 
到 子 网 223. 1. 2/24 的 一 台 DHCP 服务 器 ， 具 有 一 台 提 供 中 继 代 理 服务 的 路 由 需 ， 它 为 连 
接 到 子 网 223. 1. 1/24 和 223. 1.3/24 的 到 达 客 户 提供 DHCP 服务 。 在 我 们 下 面 的 讨论 中 ， 
将 假定 DHCP 服务 器 在 该 子 网 上 是 可 供 使 用 的 。 

DHCP 

服务 器 


加 一 
223. 1.2.5 


223.1 N 








223.1.1.4 223.1.2,9 
223.1.2.1 
22312 
到 达 的 
DHCP 客 户 





223.1.2.2 
223:1:1:3 





223.1.3.1 223.1.3.2 
图 4-23 DHCP 客户 和 服务 大 


对 于 一 台新 到 达 的 主机 而 言 ， 针 对 图 4-23 所 示 的 网 络 设置 ，DHCP 协议 是 一 个 4 个 步 
又 的 过 程 ， 如 图 4-24 中 所 示 。 在 这 幅 图 中 ，yiaddr (表示 “你 的 因特网 地 址 ”之 意 ) 指示 
分 配给 该 新 到 达 客 户 的 地 址 。 

这 4 个 步骤 是 : 

© DHCP 服务 器 发 现 。 一 台新 到 达 的 主机 的 首要 任务 是 发 现 一 个 要 与 其 交互 的 DHCP 

服务 器 。 这 可 通过 使 用 DHCP 发 现 报 文 (DHCP discover message) 来 完成 ， 客 户 在 
UDP 分 组 中 向 端口 67 发 送 该 发 现 报 文 。 该 UDP 分 组 封装 在 一 个 卫 数据 报 中 。 但 是 
这 个 数据 报应 发 给 谁 呢 ?7 主机 甚至 不 知道 它 所 连接 网 络 的 IP 地址， 更 不 用 说 用 于 该 
网 络 的 DHCP 服务 器 地 址 了 。 在 这 种 情况 下 ，DHCP 客户 生成 包含 DHCP 发 现 报 文 的 
IP 数据 报 ， 其 中 使 用 广播 目的 地 址 255. 255. 255. 255 并 且 使 用 “本 主机 ” 源 IP 地 址 
0.0.0.0, DHCP 客户 将 该 IP 数 据 报 传递 给 链 路 层 ， 链 路 层 然后 将 该 帧 广播 到 所 有 与 
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该 子 网 连接 的 节点 (我 们 将 在 6. 4 节 中 涉及 链 路 层 广播 的 细节 ) 。 


DHCP 服 务 器 
223.1.2.5 
到 达 的 客户 


` DHCP 发 现 
。 |sre: 0.0.0.0, 68 
dest: 255.255.255.255,67 













DHCPDISCOVER 
yiaddr: 0.0.0.0 
transaction ID: 654 





DHCP 提 供 










DHCP 请 求 Lifetime: 3600 secs 


DHCP server ID: 223.1.2.5 
Lifetime: 3600 secs 








DHCP ACK 


src; 223.1.2.5, 67 
dest: 255.255.255.255,68 








Lifetime: 3600 secs 


下 
时 间 时 间 
图 4-24 DHCP 客户 -MRA ARH. 


DHCP 服务 器 提供 。DHCP 服务 器 收 到 一 个 DHCP 发 现 报 文 时 ， 用 DHCP 提供 报 
文 《DHCP offer message) 回 客 户 做 出 响应 ， 该 报 文 向 该 子 网 的 所 有 节点 广播 ， 仍 
然 使 用 IP 广播 地 址 255. 255. 255.255 〈 你 也 许 要 思考 一 下 这 个 服务 需 为 何 也 必须 
采用 广播 ) 。 因 为 在 子 网 中 可 能 存在 几 个 DHCP 服务 器 ， 该 客户 也 许 会 发 现 它 处 于 
能 在 几 个 提供 者 之 间 进 行 选择 的 优越 位 置 。 每 台 服 务 问 提供 的 报 文 包含 有 收 到 的 
发 现 报 文 的 事务 D, MAP HEW IP 地址、 网 络 掩 码 以 及 IP 地 址 租用 期 (ad- 
dress lease time) ， 即 IP 地 址 有 效 的 时 间 量 。 服 务 器 租用 期 通常 设置 为 几 小 时 或 几 
天 [ Droms 2002 |。 

DHCP 请 求 。 新 到 达 的 客户 从 一 个 或 多 个 服务 器 提供 中 选择 一 个 ， 并 向 选中 的 服 
Fan be HE AY DHCP 请 求 报 文 (DHCP request message) 进行 啊 应 ， 回 显 配置 的 
参数 。 

DHCP ACK。 服 务 器 用 DHCP ACK 报 文 (DHCP ACK message) 对 DHCP 请 求 报 文 
进行 响应 ， 证 实 所 要 求 的 参数 。 


一 旦 客户 收 到 DHCP ACK 后 ， 交 互 便 完成 了 ， 并 且 该 客户 能 够 在 租用 期 内 使 用 DHCP 
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分 配 的 IP 地 址 。 因 为 客户 可 能 在 该 租用 期 超时 后 还 和 希望 使 用 这 个 地 址 ， 所 以 DHCP 还 提 
供 了 一 种 机 制 以 允许 客户 更 新 它 对 一 个 IP 地 址 的 租用 。 

从 移动 性 角度 看 ，DHCP 确实 有 非常 严重 的 缺陷 。 因 为 每 当 节 点 连 到 一 个 新 子 网 ， 要 
从 DHCP 得 到 一 个 新 的 IP 地 址 ， 当 一 个 移动 节点 在 子 网 之 间 移 动 时 ， 就 不 能 维持 与 远程 
应 用 之 间 的 TCP 连接 。 在 第 6 章 中 ， 我们 将 人 研究 移动 P， 它 是 一 种 对 IP 基础 设施 的 扩展 ， 
允许 移动 节点 在 网 络 之 间 移 动 时 使 用 其 单一 永久 的 地 址 。 有 关 DHCP 的 其 他 细 市 可 在 
| Droms 2002] 与 [dhe 2016] 中 找到 。 一 个 DHCP 的 开放 源码 参考 实现 可 从 因特网 系统 
协会 [ISC 2016] 得 到 。 


4.3.4 网络 地 址 转换 


讨论 了 有 关 因 特 网 地 址 和 IPv4 数据 报 格式 后 ， 我 们 现在 可 清楚 地 认识 到 每 个 卫 使 能 
的 设备 都 需要 一 个 IP 地 址 。 随 着 所 谓 小 型 办 公 室 、 家 庭 办 公 室 (Small Office, Home 
Office, SOHO) 子 网 的 大 量 出 现 ， 看 起 来 意味 着 每 当 一 个 SOHO 想 安装 一 个 LAN 以 互联 
多 台 机 器 时 ， 需 要 ISP 分 配 一 组 地 址 以 供 该 SOHO 的 所 有 人 设备 (包括 电话 、 平 板 电 脑 、 
游戏 设备 、IP TV、 打 印 机 等 ) 使 用 。 如 果 该 子 网 变 大 了 ， 则 需要 分 配 一 块 较 大 的 地 址 。 
但 如 果 ISP 已 经 为 SOHO 网 络 的 当前 地 址 范围 分 配 过 一 块 连续 地 址 该 怎么 办 呢 ? 并 且 ， 家 
庭 主人 一 般 要 (或 应 该 需要 ) 首先 知道 的 管理 P 地 址 的 典型 方法 有 哪些 呢 ? 幸运 的 是 ， 
有 一 种 简单 的 方法 越 来 越 广泛 地 用 在 这 些 场 合 : 网 络 地 址 转换 (Network Address Transla- 
tion, NAT) [RFC 2663; RFC 3022; Huston 2004; Zhang 2007; Cisco NAT 2016], 

图 4-25 显示 了 一 台 NAT 使 能 路 由 器 的 运行 情况 。 位 于 家 中 的 NAT 使 能 的 路 由 器 有 一 
个 接口 ， 该 接口 是 图 4-25 中 右 侧 所 示 家 庭 网 络 的 一 部 分 。 在 家 庭 网 络 内 的 编 址 就 像 我 们 
在 上 面 看 到 的 完全 一 样 ， 其 中 的 所 有 4 个 接口 都 具有 相同 的 网 络 地 址 10. 0.0/24。 地 址 空 
间 10. 0. 0. 0/8 是 在 [RFC 1918] 中 保留 的 三 部 分 IP 地址 空间 之 一 ， 这 些 地 址 用 于 如 图 4- 
25 中 的 家 庭 网 络 等 专用 网 络 (private network) 或 具有 专用 地 址 的 地 域 (realm with private 
address)。 具 有 专用 地 址 的 地 域 是 指 其 地 址 仅 对 该 网 络 中 的 设备 有 意义 的 网 络 。 为 了 明白 
它 为 什么 重要 ,考虑 有 数 十 万 家 庭 网 络 这 样 的 事实 ,许多 使 用 了 相同 的 地 址 空间 
10. 0. 0.0/24。 在 一 个 给 定 家 庭 网 络 中 的 设备 能 够 使 用 10.0.0.0/24 编 址 彼此 发 送 分 组 。 
然而 ， 转 发 到 家 庭 网 络 之 外 进入 更 大 的 全 球 因 特 网 的 分 组 显然 不 能 使 用 这 些 地 址 (或 作为 
源 地 址 ， 或 作为 目的 地 址 ) ， 因 为 有 数 十 万 的 网 络 使 用 着 这 块 地 址 。 这 就 是 说 ，10. 0. 0. 0/ 
24 地 址 仅 在 给 定 的 网 络 中 才 有 意义 。 但 是 如 果 专 用 地 址 仅 在 给 定 的 网 络 中 才 有 意义 的 话 ， 
当 回 或 从 全 球 因 特 网 发 送 或 接收 分 组 时 如 何 处 理 编 址 问题 呢 ， 地 址 在 何 处 才 必 须 是 唯一 的 
呢 ? 答案 在 于 理解 NAT。 

NAT 使 能 路 由 需 对 于 外 部 世界 来 说 甚至 不 像 一 台 路 由 器 。 相 反 NAT 路 由 需 对 外 界 的 
行为 就 如 同一 个 具有 单一 IP 地 址 的 单一 设备 。 在 图 4-25 中 ， 所 有 离开 家 庭 路 由 需 流 辐 更 
大 因特网 的 报 文 都 拥有 一 个 源 IP 地 址 138. 76. 29.7， 且 所 有 进入 家 庭 的 报 文 都 拥有 同一 个 
目的 IP 地 址 138. 76. 29.7。 从 本 质 上 讲 ，NAT 使 能 路 由 器 对 外 界 隐 藏 了 家 庭 网 络 的 细节 。 
(另外 ， 你 也 许 想 知道 家 庭 网 络 计 算 机 是 从 哪儿 得 到 其 地 址 ， 路 由 器 又 是 从 哪儿 得 到 它 的 
单一 IP 地 址 的 。 在 通常 的 情况 下 ， 和 答案 是 相同 的 ， 即 DHCP! 路 由 器 从 ISP 的 DHCP 服务 
器 得 到 它 的 地 址 ， 并 且 路 由 器 运行 一 个 DHCP 服务 器 ， 为 位 于 NAT-DHCP 路 由 器 控制 的 家 
庭 网 络 地 址 空间 中 的 计算 机 提供 地 址 。) 
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138.76.29.7, 5001 10.0.0.1, 3345 


S = 10.0.0.1, 3345 
S = 138.76.29.7, 5001 
D = 128.119.40.186, 8 


D = 128.119.40.186, 8 9 
10.0.0.1 
>< a as, 
138.76.29.7 
S = 128.119.40.186, 80 S = 128.119.40.186, 80 
D = 138.76.29.7, 5001 D = 10.0.0.1, 3345 
图 4-25 网络 地 址 转换 


oe 10.0.0.2 
eo 10.0.0.3 

如 果 从 广域网 到 达 NAT 路 由 器 的 所 有 数据 报 都 有 相同 的 目的 IP 地 址 (特别 是 对 NAT 
路 由 器 广域网 一 侧 的 接口 ) ， 那 么 该 路 由 器 怎样 知道 它 应 将 某 个 分 组 转发 给 哪个 内 部 主机 
WE? 技巧 就 是 使 用 NAT 路 由 器 上 的 一 张 NAT 转换 表 (NAT translation table) ， 并 且 在 表 项 
中 包含 了 端口 号 及 其 IP 地 址 。 

考虑 图 4-25 中 的 例子 。 假 设 一 个 用 户 坐 在 家 庭 网 络 主机 10. 0. 0. 1 后 ， 请 求 IP 地 址 为 
128. 119. 40. 186 HS Web 服务 器 (端口 80) 上 的 一 个 Web 页 面 。 主 机 10. 0.0. 1 为 其 
指派 了 (任意 ) 源 端 口号 3345 并 将 该 数据 报 发 送 到 LAN 中 。NAT 路 由 融 收 到 该 数据 报 ， 
为 该 数据 报 生成 一 个 新 的 源 端 口号 5001, KUR IP 蔡 代 为 其 广域网 一 侧 接口 的 下 地 址 
138. 76. 29.7， 且 将 源 端口 3345 更 换 为 新 端口 5001。 当 生成 一 个 新 的 源 端口 号 时 ，NAT 路 
由 器 可 选择 任意 一 个 当前 未 在 NAT 转换 表 中 的 源 端 口号 。 (注意 到 因为 端口 号 字段 为 16 
LORE, NAT 协议 可 支持 超过 60 OOO 个 并 行使 用 路 由 器 广域网 一 侧 单 个 IP 地 址 的 连接 !) 
路 由 器 中 的 NAT 也 在 它 的 NAT 转换 表 中 增加 一 表 项 。Web 服务 大 并 不 知道 刚 到 达 的 包含 
HTTP 请 求 的 数据 报 已 被 NAT 路 由 器 进行 了 改装 ， 它 会 发 回 一 个 啊 应 报 文 ， 其 目的 地 址 是 
NAT 路 由 器 的 IP 地 址 ， 其 目的 端口 是 5001。 当 该 报 文 到 达 NAT 路 由 器 时 ， 路 由 需 使 用 目 
的 IP 地 址 与 目的 端口 号 从 NAT 转换 表 中 检索 出 家 庭 网 络 浏览 絮 使 用 的 适当 IP 地 址 
(10.0.0.1) 和 目的 端口 号 (3345 ) 。 于 是 ， 路 由 器 重 写 该 数据 报 的 目的 IP 地 址 与 目的 端 
口号 ， 并 向 家 庭 网 络 转发 该 数据 报 。 

NAT 在 近年 来 已 得 到 了 广泛 的 应 用 。 但 是 NAT 并 非 没有 贬低 者 。 首 先 ， 有 人 认为 端 
口号 是 用 于 进程 寻 址 的 ， 而 不 是 用 于 主机 寻 址 的 。 这 种 违规 用 法 对 于 运行 在 家 庭 网 络 中 的 
服务 器 来 说 确实 会 引起 问题 ， 因 为 正如 我 们 在 第 2 章 所 见 ， 服 务 嚣 进程 在 周知 端口 号 上 等 
FARR, JHH. P2P 协议 中 的 对 等 方 在 充当 服务 器 时 需要 接受 入 连接 。 对 这 些 问题 的 技术 
解决 方案 包括 NAT 穿越 (NAT traversal) 工具 | RFC 5389] 和 通用 即 插 即 用 (Universal 
Plug and Play, UPnP), UPnP 是 一 种 允许 主机 发 现 和 配置 邻近 NAT 的 协议 [LUPnP Forum 
2016 | . 

其 次 ， 纯 粹 的 体系 结构 者 提出 了 更 为 “原理 性 的 ”反对 NAT 的 意见 。 这 时 ， 关 注 焦 
点 在 于 路 由 器 是 指 第 三 层 ( 即 网 络 层 ) 设备 ， 并 且 应 当 处 理 只 能 达到 网 络 层 的 分 组 。NAT 
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违反 主机 应 当 直 接 彼此 对 话 这 个 原则 ， 没 有 干涉 节点 修改 IP 地 址 ， 更 不 用 说 端口 号 。 但 
PERKISTE, NAT 已 成 为 因特网 的 一 个 重要 组 件 ， 成 为 所 谓 中 间 盒 [Sekar 2011], € 
运行 在 网 络 层 并 具有 与 路 由 顺 十 分 不 同 的 功能 。 中 间 盒 并 不 执行 传统 的 数据 报 转发 ， 而 是 
执行 诸如 NAT、 流 量 流 的 负载 均衡 、 流 量 防火 墙 (参见 下 面 的 插入 框 内 容 ) 等 功能 。 我 
们 将 在 随后 的 4. 4 节 学 习 的 通用 转发 范例 ， 除 了 传统 的 路 由 需 转 发 外 ， 还 允许 一 些 这 样 的 
中 间 盒 功能 ， 从 而 以 通用 、 综 合 的 方式 完成 转发 。 


检查 数据 报 : 防火 墙 和 入 侵 检 测 系统 


假定 你 被 赋予 了 管理 家 庭 网 络 、 部 门 网 络 、 大 学 网 络 或 公司 网 络 的 任务 。 知 道 你 网 
络 IP 地 址 范围 的 攻击 者 ， 能 够 方便 地 在 此 范围 中 发 送 IP 数据 报 进 行 寻 址 。 这 些 数据 报 
能 够 做 各 种 不 正当 的 事情 ， 包 括 用 ping 搜索 和 端口 扫描 形成 你 的 网 络 图 ， 用 恶意 分 组 使 
' 易 受 攻击 的 主机 崩 演 ， 扫 描 你 网 络 中 服务 器 上 的 开放 TCP/UDP 端口 ， 并 且 通 过 在 分 组 
' 中 带 有 恶意 软件 来 感染 主机 。 作 为 网 络 管理 员 ， 你 准备 做 些 什么 来 将 这 些 能 够 在 你 的 网 
络 中 发 送 恶 意 分 组 的 坏 家 伙 拒 之 门 外 呢 ?对 抗 恶 意 分 组 攻击 的 两 种 流行 的 防御 措施 是 防 
火 墙 和 入 侵 检 测 系统 (IDS) 。 

作为 一 名 网 络 管理 员 ， 你 可 能 首先 尝试 在 你 的 网 络 和 因特网 之 间 安 装 一 台 防 火 墙 。 
' (今天 大 多 数 接 入 路 由 器 有 具有 防火 墙 能 力 ,) 防火 墙 检查 数据 报 和 报 文 段 首 部 字段 ， 拒 绝 
可 疑 的 数据 报 进 入 内 部 网 络 。 例 如 ， 一 台 防 火 墙 可 以 被 配置 为 阻挡 所 有 的 ICMP 回 显 请 
求 分 组 (参见 5.6 节 )， 从 而 防止 了 攻击 者 模 跨 你 的 IP 地 址 范围 进行 传统 的 端口 扫描 。 
防火 墙 也 能 基于 源 和 目的 IP 地 址 以 及 端口 号 阻挡 分 组 。 此 外 ， 防火墙 能 够 配置 为 跟踪 
TCP 连接 ， 仅 许可 属于 批准 连接 的 数据 报 进 入 。 | 

IDS 能 够 提供 另 一 种 保护 措施 。IDS 通常 位 于 网 络 的 边界 ， 执 行 “ 深 度 分 组 检查 ”， 
不 仅 检 查 数 据 报 (包括 应 用 层 数据 ) 中 的 首部 字段 ， 而 且 检 查 其 有 效 载荷 。IDS 具有 一 
个 分 组 特征 数据 库 ， 这 些 特 征 是 已 知 攻击 的 一 部 分 。 随 着 新 攻击 的 发 现 ， 该 数据 库 自动 
更 新 特征 。 当 分 组 通过 IDS 时 ，IDS 试图 将 分 组 的 首部 字段 和 和 有效 载荷 与 其 特征 数据 库 
中 的 特征 相 匹配 。 如 果 发 现 了 这 样 的 一 种 匹配 ， 就 产生 一 个 告警 。 入 侵 防 止 系统 (IPS) 
与 IDS 类 似 ， 只 是 除了 产生 告警 外 还 实际 阻挡 分 组 。 在 第 8 章 中 ， 我 们 将 更 为 详细 地 研 
| 究 防 火 墙 和 IDS。 

防火 墙 和 IDS 能 够 全 面 保护 你 的 网 络 免 受 所 有 攻击 吗 ?9 答案 显然 是 否定 的 ， 因 为 攻 
击 者 继续 寻找 特征 还 不 能 匹配 的 新 攻击 方法 。 但 是 防火 墙 和 传统 的 基于 特征 的 IDS 在 保 
护 你 的 网 络 不 受 已 知 攻击 入 侵 方 面 是 有 用 的 。 











4.3.5 IPv6 


在 20 世纪 90 年 代 早期 ， 因 特 网 工程 任务 组 就 开始 致力 于 开发 一 种 替代 IPv4 的 协议 。 
该 努力 的 首要 动机 是 以 下 现实 : 由 于 新 的 子 网 和 卫 节点 以 惊人 的 增长 率 连 到 因特网 上 
(并 被 分 配 唯 一 的 了 地址 )，32 比特 的 IP 地 址 空间 即将 用 尽 。 为 了 应 对 这 种 对 大 IP 地 址 
空间 的 需求 ， 开 发 了 一 种 新 的 IP 协议 ， 即 IPv6。IPv6 的 设计 者 还 利用 这 次 机 会 ， 在 IPv4 
积累 的 运行 经 验 基 础 上 加 进 和 强化 了 IPv4 的 其 他 方面 。 
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IPv4 地 址 在 什么 时 候 会 被 完全 分 配 完 (因此 没有 新 的 网 络 再 能 与 因特网 相连 ) 是 一 
个 相当 有 争议 的 问题 。IETF 的 地 址 寿命 期 望 工作 组 的 两 位 负责 人 分 别 估 计 地 址 将 于 2008 
年 和 2018 年 用 完 [Solensky 1996]。 在 2011 年 2 月 ，IANA 回 一 个 区 域 注册 机 构 分 配 完 了 
未 分 配 IPv4 地 址 的 最 后 剩余 地 址 池 。 这 些 注册 机 构 在 它们 的 地 址 池 中 还 有 可 用 的 IPv4 地 
Hh, 一旦 用 完 这 些 地 址 ， 从 中 央 池 中 将 再 也 分 配 不 出 更 多 的 可 用 地 址 块 了 [Huston 
2011a] 。IPv4 地 址 空间 耗 尽 的 近期 调研 以 及 延长 该 地 址 空间 的 寿命 所 采取 的 步骤 见 
[ Richter 2015 | 。 

尽管 在 20 世纪 90 年 代 中 期 对 IPv4 地 址 耗 尽 的 估计 表明 ，IPv4 地 址 空间 耗 尽 的 期 限 还 
有 可 观 的 时 间 ， 但 人 们 认识 到 ， 如 此 大 规模 地 部 署 一 项 新 技术 将 需要 可 观 的 时 间 ， 因 此 研 
发 正版 本 6 (IPv6) [RFC 2460] 的 工作 开始 了 [RFC 1752], (一 个 经 常 问 的 问题 是 : 


IPv5 出 了 什么 情况 ? 人们 最 初 预想 ST-2 协议 es 

将 成 为 IPv5， 但 ST- 2 后 来 被 舍弃 了 。) AK 

IPv6 的 优秀 信息 来 源 见 [ Huitema 1998 | 。 版 本 ”流量 类 型 流标 签 
1. IPv6 数据 报 格 式 有 效 载 荷 长 度 下 一 个 首部 。”， 跳 限制 
IPv6 数据 报 的 格式 如 图 4-26 所 示 。 源 地 址 ‘128 比特 
IPv6 中 引入 的 最 重要 的 变化 显示 在 其 数据 目的 地 址 (128 比特 ) 

报 格式 中 : 数据 


e 扩大 的 地 址 容量 。IPv6 将 IP 地 址 长 度 
从 32 比特 增加 到 128 比特 。 这 就 确保 
全 世界 将 不 会 用 尽 IP 地 址 。 现 在 ， 地 球 上 的 每 个 沙砾 都 可 以 用 IP 地 址 寻 址 了 。 除 
了 单 播 与 多 播 地 址 以 外 ，IPv6 还 引入 了 一 种 称 为 任 播 地 址 (anycast address) 的 新 
型 地 址 ， 这 种 地 址 可 以 使 数据 报 交付 给 一 组 主机 中 的 任意 一 个 。( 例如 ， 这 种 特性 
可 用 于 向 一 组 包含 给 定 文档 的 镜像 站 点 中 的 最 近 一 个 发 送 HTTP GET FRX.) 

e 简化 高 效 的 40 字 节 首部 。 如 下 面 讨 论 的 那样 ， 许 多 IPv4 字段 已 被 舍弃 或 作为 选 
项 。 因 而 所 形成 的 40 字 节 定 长 首部 允许 路 由 器 更 快 地 处 理 IP 数据 报 。 一 种 新 的 
选项 编码 允许 进行 更 灵活 的 选项 处 理 。 

e 流标 签 。IPv6 有 一 个 难以 捉摸 的 流 (flow) 定义 。RFC 2460 中 描述 道 ， 该 字段 可 
用 于 “给 属于 特殊 流 的 分 组 加 上 标签 ， 这 些 特 殊 流 是 发 送 方 要 求 进行 特殊 处 理 的 
流 ， 如 一 种 非 默认 服务 质量 或 需要 实时 服务 的 流 ”。 人 例如， 音频 与 视频 传输 就 可 能 
被 当 作 一 个 流 。 男 一 方面 ， 更 为 传统 的 应 用 ( 如 文件 传输 和 电子 邮件 ) 就 不 可 能 
被 当 作 流 。 由 高 优先 权 用 户 (如 某 些 为 使 其 流量 得 到 更 好 服务 而 付费 的 用 户 ) 承 
载 的 流量 也 有 可 能 被 当 作 一 个 流 。 然 而 ，IPv6 的 设计 者 显然 已 预见 到 最 终 需 要 能 
够 区 分 这 些 流 ， 即 使 流 的 确切 含义 还 未 完全 确定 。 

如 上 所 述 ， 比 较 图 4-26 与 图 4-16 就 可 看 出 ，IPv6 数据 报 的 结构 更 简单 、 更 高 效 。 以 

下 是 在 IPv6 中 定义 的 字段 。 

© 版 本 。 该 4 比特 字段 用 于 标识 P 版 本 号 。 训 不 奇怪 ，IPv6 将 该 字段 值 设 为 6。 注 
意 到 将 该 字段 值 置 为 4 并 不 能 创建 一 个 合法 的 IPv4 数据 报 。 (如 果 这 样 的 话 ， 事 
情 就 简单 多 了 ， 参 见 下 面 有 关 从 IPv4 m) IPv6 迁移 的 讨论 。) 

e 流量 类 型 。 该 8 比特 字段 与 我 们 在 IPv4 中 看 到 的 TOS 字段 的 含义 相似 。 

e 流标 签 。 如 上 面 讨论 过 的 那样 ， 该 20 比特 的 字段 用 于 标识 一 条 数据 报 的 流 ， 能 够 


图 4-26 IPv6 数据 报 格式 
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对 一 条 流 中 的 某 些 数据 报 给 出 优先 权 ， 或 者 它 能 够 用 来 对 来 自 某 些 应 用 (例如 了 IP 
话音 ) 的 数据 报 给 出 更 高 的 优先 权 ， 以 优 于 来 自 其 他 应 用 (例如 SMTP 电子 邮件 ) 
的 数据 报 。 

© 有 效 载荷 长 度 。 该 16 比特 值 作为 一 个 无 符号 整数 ， 给 出 了 IPv6 数据 报 中 跟 在 定 长 
的 40 字 节 数据 报 首部 后 面 的 字 节 数量 。 

© 下 一 个 首部 。 该 字段 标识 数据 报 中 的 内 容 (数据 字段 ) 需要 交付 给 哪个 协议 (如 
TCP 或 UDP) 。 该 字段 使 用 与 IPv4 首部 中 协议 字段 相同 的 值 。 

o 跳 限制 。 转 发 数据 报 的 每 台 路 由 器 将 对 该 字段 的 内 容 减 1。 如 果 跳 限制 计数 达到 

0， 则 该 数据 报 将 被 丢弃 。 

源 地 址 和 目的 地 址 。IPv6 128 比特 地 址 的 各 种 格式 在 RFC 4291 中 进行 了 描述 。 

数据 。 这 是 IPv6 数据 报 的 有 效 载荷 部 分 。 当 数据 报到 达 目 的 地 时 ,该 有 效 载荷 就 

从 数据 报 中 移出 ， 并 交 给 在 下 一 个 首部 字段 中 指定 的 协议 处 理 。 

以 上 讨论 说 明了 IPv6 数据 报 中 包括 的 各 字段 的 用 途 。 将 图 4-26 中 的 IPv6 数据 报 格式 
与 图 4-16 中 的 IPv4 数据 报 格式 进行 比较 ， 我们 就 会 注意 到 ， 在 IPv4 数据 报 中 出 现 的 几 个 
字段 在 IPv6 数据 报 中 已 不 复 存 在 : 

e 分 片 /重新 组 装 。IPv6 不 允许 在 中 间 路 由 器 上 进行 分 片 与 重新 组 装 。 这 种 操作 只 能 

在 源 与 目的 地 执行 。 如 果 路 由 器 收 到 的 IPv6 数据 报 因 太 大 而 不 能 转发 到 出 链 路 上 
的 话 ， 则 路 由 需 只 需 丢 抒 该 数据 报 ， 并 向 发 送 方 发 回 一 个 “分 组 太 大 ”的 ICMP 
差错 报 文 即 可 ( 见 5.6 节 ) 。 于 是 发 送 方 能 够 使 用 较 小 长 度 的 IP 数据 报 重 发 数据 。 
分 片 与 重新 组 装 是 一 个 耗 时 的 操作 ， 将 该 功能 从 路 由 器 中 删除 并 放 到 端 系统 中 ， 
大 大 加 快 了 网 络 中 的 IP 转发 速度 。 

e 首部 检验 和 。 因 为 因特网 层 中 的 运输 层 (如 TCP 5 UDP) 和 数据 链 路 层 (如 以 太 
网 ) 协议 执行 了 检验 操作 ，IP 设计 者 大 概 觉 得 在 网 络 层 中 具有 该 项 功能 实 属 多 
余 ， 所 以 将 其 去 除 。 再 次 强调 的 是 ， 快 速 处 理 分 组 是 关注 的 重点 。 在 4.3.1 节 
中 我 们 讨论 IPv4 时 讲 过 ， 由 于 IPv4 首部 中 包含 有 一 个 TTL 字 段 (类 似 于 IPv6 中 的 
跳 限制 字段 ) ， 所 以 在 每 台 路 由 器 上 都 需要 重新 计算 Pv 首部 检验 和 。 就 像 分 片 
与 重新 组 装 一 样 ， 在 IPv4 中 这 也 是 一 项 耗 时 的 操作 。 

© 选项 。 选 项 字段 不 再 是 标准 IP 首部 的 一 部 分 了 。 但 它 并 没有 消失 ， 而 是 可 能 出 现 
在 IPv6 首部 中 由 “下 一 个 首部 ”指出 的 位 置 上 。 这 就 是 说 ， 就 像 TCP 或 UDP th 
议 首部 能 够 是 IP 分 组 中 的 “下 一 个 首部 ”一 样 ， 选 项 字段 也 能 是 “下 一 个 首部 ”。 
删除 选项 字段 使 得 IP 首部 成 为 定 长 的 40 字 节 。 

2. 从 IPv4 到 IPv6 的 迁移 


既然 我 们 已 了 解 了 IPv6 的 技术 细节 ， 那 么 我 们 考虑 一 个 非常 实际 的 问题 : 基于 IPv4 
的 公共 因特网 如 何 迁 移 到 IPv6 呢 ? 问题 是 ， 虽 然 新 型 IPv6 使 能 系统 可 做 成 向 后 兼容 ， 即 
能 发 送 、 路 由 和 接收 IPv4 数据 报 ， 但 已 部 署 的 具有 IPv4 能 力 的 系统 却 不 能 够 处 理 IPv6 数 
据 报 。 可 以 采用 以 下 几 种 方法 | Huston 2011b; RFC 4213], 

一 种 可 选 的 方法 是 宣布 一 个 标志 日 ， 即 指定 某 个 日 期 和 时 间 ， 届 时 因特网 的 所 有 机 器 
都 关机 并 从 IPv4 升级 到 IPv6。 上 次 重大 的 技术 迁移 (为 得 到 可 靠 的 运输 服务 ， 从 使 用 
NCP 迁移 到 使 用 TCP) 出 现在 差不多 35 年 以 前 。 即 使 回 到 那 时 [RFC 801 | 因特网 
很 小 且 仍 然 由 少数 “奇才 ”管理 着 ， 人 们 也 会 认识 到 选择 这 样 一 个 标志 日 是 不 可 行 的 。 一 
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个 涉及 数 十 亿 台 机 器 的 标志 日 现在 更 是 不 可 想象 的 。 

在 实践 中 已 经 得 到 广泛 采用 的 IPv4 到 IPv6 迁移 的 方法 包括 建 隧道 (tunneling) 
[RFC 4213], BRS IPv4 到 IPv6 迁移 之 外 的 许多 其 他 场合 的 应 用 都 具有 建 隧道 的 关键 概 
念 ， 包 插 在 第 7 章 将 涉及 的 全 IP 蜂 窜 网络 中 也 得 到 广泛 使 用 。 建 隆 道 依据 的 基本 思想 
如 下 : 假定 两 个 IPv6 节点 (如 图 4-27 "Pay BALE) 要 使 用 IPv6 数据 报 进行 交互 ,但 它 
们 是 经 由 中 间 IPv4 路 由 器 互联 的 。 我 们 将 两 台 IPv6 路 由 句 之 间 的 中 间 IPv4 路 由 器 的 集 
合 称 为 一 个 隧道 (tunnel), ， 如 图 4-27 所 示 。 借 助 于 隧道 ， 在 隧道 发 送 端 的 IPv6 节点 
(WB) 可 将 整个 IPv6 数据 报 放 到 一 个 IPv4 数据 报 的 数据 (Aa) 字段 中 。 于 是 ， 
该 IPv4 数据 报 的 地 址 设 为 指向 隧道 接收 端的 IPv6 节点 (在 此 例 中 为 E)， 再 发 送 给 隧道 
中 的 第 一 个 节点 (在 此 例 中 为 C)。 隧 道中 的 中 间 IPv4 路 由 ee eee 
供 路 由 ， 就 像 对 待 其 他 数据 报 一 样 ， 完 全 不 知道 该 IPv4 数据 报 自身 就 含有 一 个 完整 的 
IPv6 数据 报 。 隧 道 接 收 端 的 IPv6 节点 最 终 收 到 该 IPv4 数据 报 〈 它 是 该 IPv4 ete ts H 
的 地 ) ， 并 确定 该 IPv4 数据 报 含有 一 个 IPv6 数据 报 (通过 观察 在 IPv4 数据 报 中 的 协议 
号 字段 是 41 [RFC 4213], ， 指 示 该 IPv4 有 效 载 荷 是 IPv6 数据 报 ) ， 从 中 取出 IPv6 数据 
报 ， 然 后 再 为 该 IPv6 数据 报 提供 路 由 ， 就 好 像 它 是 从 一 个 直接 相连 的 IPv6 邻居 那里 接 
收 到 该 IPv6 数据 报 一 样 。 


逻辑 视图 
IPv6 IPv6 | 7 ~ IPv6 IPv6 





B 到 C: IPv4 
(封装 IPv6) (封装 IPv6) 


图 4-27 PIŠ 


在 结束 本 节 前 需要 说 明 的 是 ， 尽 管 采用 IPv6 最 初 表现 为 一 个 绥 慢 启动 的 过 程 【 Lawton 
2001; Huston 2008b] ， 但 势头 已 经 有 了 。NIST [NIST IPv6 2015] 报告 称 ， 超 过 三 分 之 一 
的 美国 政府 二 级 域名 是 支持 IPv6 的 。 在 客户 端 ， 谷 歌 报 告 称 访问 谷歌 服务 的 客户 仅 有 8% 
使 用 了 IPv6 [Google IPv6 2015 ] 。 但 其 他 最 近 统 计 结 果 指 出 [Czyz 2014], IPv6 的 采用 正 
在 加 速 。 诸 如 IP 使 能 的 电话 和 其 他 便携 式 设备 的 激增 ， 为 IPv6 的 更 广泛 部 署 提供 了 新 的 
推动 力 。 欧 洲 的 第 三 代 合 作 计 划 [3GPP 2016] 已 规定 了 IPv6 为 移动 多 媒体 的 标准 编 址 
方案 。 
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我 们 能 从 IPv6 经 验 中 学 到 的 重要 一 课 是 ， 要 改变 网 络 层 协议 是 极其 困难 的 。 目 从 20 
世纪 90 年 代 早 期 以 来 ， 有 许多 新 的 网 络 层 协议 被 鼓吹 为 因特网 的 下 一 次 重大 革命 ， 但 这 
些 协议 中 的 大 多 数 至 今 为 止 只 取得 了 有 限 突破 。 这 些 协议 包括 PPv6 、 多 播 协议 、 资 源 预 贸 
协议 ， 其 中 后 面 两 个 协议 的 讨论 可 在 本 书 的 在 线 补充 材料 中 找到 。 在 网 络 层 中 引入 新 的 协 
议 的 确 如 同 蔡 换 一 由 房子 的 基石 ， 即 在 不 拆 拯 整 由 房子 (或 至 少 临 时 重新 安置 房屋 住户 ) 
的 情况 下 是 很 难 完成 上 述 工 作 的 。 男 一 方面 ， 因 特 网 却 已 见证 了 在 应 用 层 中 新 协议 的 快速 
部 署 。 典 型 的 例子 当然 有 Web、 即 时 讯息 、 流 媒体 、 分 布 式 游戏 和 各 种 形式 的 社交 媒体 。 
引入 新 的 应 用 层 协 议 就 像 给 一 幢 房 子 重新 刷 一 层 漆 ， 这 是 相对 容易 做 的 事 ， 如 果 你 选择 了 
一 个 好 看 的 颜色 ， 邻 居 将 会 照搬 你 的 选择 。 总 之 ， 未 来 我 们 肯定 会 看 到 因特网 网 络 层 发 生 
改变 ， 但 这 种 改变 将 比 应 用 层 慢 得 多 。 


4.4 通用 转发 和 SDN 


在 4.2. 1 节 中 ， 我 们 注意 到 因特网 路 由 器 的 转发 决定 传统 上 仅仅 基于 分 组 的 目的 地 
址 。 然 而 ， 在 前 一 节 中 ,我们 也 已 经 看 到 执行 许多 第 三 层 功能 的 中 间 盒 有 了 大 量 发 展 。 
NAT 盒 重 写 首 部 IP 地 址 和 端口 号 ; 防火 墙 基于 首部 字段 值 阻 拦 流量 或 重 定向 分 组 以 进行 
其 他 处 理 ， 如 深度 分 组 检测 (DPI) 。 负 载 均衡 器 将 请 求 某 种 给 定 服务 (例如 一 个 HTTP 请 
求 ) 的 分 组 转发 到 提供 该 服务 的 服务 器 集合 中 的 一 个 。[LRFC 3234] 列 出 了 许多 和 常用 中 间 
盒 功能 。 

第 二 层 交 换 机 和 第 三 层 路 由 器 等 中 间 盒 [Qazi 2013] 的 剧 增 ， 而 且 每 种 都 有 目 己 特殊 
的 硬件、 软件 和 管理 界面 ， 无 疑 给 许多 网 络 操作 员 带 来 了 十 分 头疼 的 大 麻烦 。 然 而 ， 近 期 
软件 定义 网 络 的 进展 已 经 预示 并 且 正 在 提出 一 种 统一 的 方法 ， 以 一 种 现代 、 简 洁 和 综合 方 
式 ， 提 供 多 种 网 络 层 功能 以 及 某 些 链 路 层 功能 。 

回顾 4.2. 1 节 将 基于 目的 地 转发 的 特征 总 结 为 两 个 步骤 : AERA AY IP Bek (“ 匹 
配 ”) ， 然 后 将 分 组 发 送 到 有 特定 输出 端口 的 交换 结构 (“动作”) 。 我 们 现在 考虑 一 种 更 有 
意义 的 通用 “匹配 加 动作 ”范式 ， 其 中 能 够 对 协议 栈 的 多 个 首部 字段 进行 “匹配 ”， 这 些 
首部 字段 是 与 不 同 层 次 的 不 同 协议 相关 联 的 。“ 动作” 能 够 包括 : 将 分 组 转发 到 一 个 或 多 
个 输出 端口 〈 就 像 在 基于 目的 地 转发 中 一 样 ) ， 路 越 多 个 通 向 服务 的 离开 接口 进行 负载 均 
衡 分 组 〈 就 像 在 负载 均衡 中 一 样 ) ， 重 写 首 部 值 ORIRE NAT 中 一 样 ) ， 有 意识 地 阻挡 / 丢 
弃 某 个 分 组 (就 像 在 防火 墙 中 一 样 )， 为 进一步 处 理 和 动作 而 向 某 个 特定 的 服务 器 发 送 一 
个 分 组 (就 像 在 DPI 一 样 ) ， 等 等 。 

在 通用 转发 中 ， 一 张 匹配 加 动作 表 将 我 们 在 4. 2. 1 节 中 看 到 的 基于 目的 地 的 转发 表 一 
般 化 了 。 因 为 能 够 使 用 网 络 层 和 /或 链 路 层 源 和 目的 地 址 做 出 转发 决定 ， 所 以 显示 在 图 4- 
28 中 的 转发 设备 更 为 准确 地 描述 为 “分 组 交换 机 ”而 不 是 第 三 层 “ 路 由 器 ”或 第 二 层 
“交换 机 ”。 因 此 ， 在 本 节 后 面部 分 以 及 5.5 节 中 ,我们 将 这 些 设备 称 为 分 组 交换 机 ， 这 是 
在 SDN 文献 中 被 广泛 采用 的 术语 。 

图 4-28 显示 了 位 于 每 台 分 组 交换 机 中 的 一 张 匹配 加 动作 表 ， 该 表 由 远程 控制 器 计算 、 
安装 和 更 新 。 我 们 注意 到 虽然 在 各 台 分 组 交换 机 中 的 控制 组 件 可 以 相互 作用 (例如 以 类 似 
于 图 4-2 中 的 方式 ) ， 但 实践 中 通用 匹配 加 动作 能 力 是 通过 计算 、 安 装 和 更 新 这 些 表 的 远 
程控 制 夯 实现 的 。 花 几 分 钟 比较 图 4-2、 图 4-3 和 图 4-28 ， 你 能 看 出 图 4-2 和 图 4-3 中 显示 
的 基于 目的 地 转发 与 图 4-28 中 显示 的 通用 转发 有 什么 相似 和 差异 吗 ? 
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到 达 分 组 首部 中 的 值 
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图 4-28 通用 转发 : 每 台 分 组 交换 机 包含 一 张 匹 配 加 动作 表 ， 该 表 是 由 远程 控制 器 计算 和 分 发 的 


我 们 后 续 对 通用 转发 的 讨论 将 基于 OpenFlow [ McKeown 2008; OpenFlow 2009; Casa- 
do 2014; Tourrilhes 2014], OpenFlow 是 一 个 得 到 高 度 认 可 和 成 功 的 标准 ， 它 已 经 成 为 匹配 
加 动作 转发 抽象 、 控 制 句 以 及 更 为 一 般 的 SDN 革命 等 概念 的 先驱 | Feamster 2013 |。 我 们 
将 主要 考虑 OpenFlow 1.0， 该 标准 以 特别 清晰 和 简明 的 方式 引 和 人 了 关键 的 SDN 抽象 和 功 
能 。OpenFlow 的 后 继 版 本 根据 实现 和 使 用 获得 的 经 验 引 入 了 其 他 能 力 ; OpenFlow 标准 的 
当前 和 早期 版 本 能 在 [ONF 2016] 中 找到 。 
匹配 加 动作 转发 表 在 OpenFlow 中 称 为 流 表 (flow table) ， 它 的 每 个 表 项 包括 : 
e 首部 字段 值 的 集合 ， 入 分 组 将 与 之 匹配 。 与 基于 目的 地 转发 的 情况 一 样 ， 基 于 硬件 
匹配 在 TCAM 内 存 中 执行 得 最 为 迅速 (TCAM 内 存 中 可 能 有 上 百 万 条 地 址 表 项 ) 
[ Bosshart 2013 ] 。 匹 配 不 上 流 表 项 的 分 组 将 被 丢弃 或 发 送 到 远程 控制 器 做 更 多 处 
理 。 在 实践 中 ， 为 了 性 能 或 成 本 原因 ， 一 个 流 表 可 以 由 多 个 流 表 实 现 | Bosshart 
2013 ] ， 但 我 们 这 里 只 关注 单一 流 表 的 抽象 。 

e 计数 器 集合 〈 当 分 组 与 流 表 项 匹配 时 更 新 计数 器 ) 。 这 些 计 数 硕 可 以 包括 已 经 与 该 
表 项 匹配 的 分 组 数量 ， 以 及 自从 该 表 项 上 次 更 新 以 来 的 时 间 。 

© 当 分 组 匹配 流 表 项 时 所 采取 的 动作 集合 。 这 些 动 作 可 能 将 分 组 转发 到 给 定 的 输出 端 
口 ， 丢 弃 该 分 组 、 复 制 该 分 组 和 将 它们 发 送 到 多 个 输出 端口 ， 和 /或 重 写 所 选 的 首 
部 字段 。 

我 们 将 在 4.4.1 节 和 4.4.2 节 中 分 别 更 为 详细 地 探讨 匹配 和 动作 。 我 们 将 学 习 每 全 4 
组 交换 机 网 络 范围 的 匹配 规则 集合 是 如 何 用 来 实现 多 种 多 样 的 功能 的 ， 包括 4. 4. 3 节 中 的 
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路 由 选择 、 第 二 层 交 换 路 由 、 防 火 墙 、 负 载 均 衡 、 虚 拟 网 络 等 等 。 在 结束 时 ， 我 们 注意 到 
流 表 本 质 上 是 一 个 API， 通 过 这 种 抽象 每 台 分 组 交换 机 的 行为 能 被 编程 ; 我 们 将 在 4. 4.3 
节 中 看 到 ， 通 过 在 网 络 分 组 交换 机 的 集合 中 适当 地 编程 /配置 这 些 表 ， 网 络 范 围 的 行为 能 
被 类 似 地 编程 | Casado 2014 | 。 


4.4.1 匹配 


图 4-29 显示 了 11 个 分 组 首部 字段 和 入 端口 ID ,该 ID 能 被 OpenFlow 1.0 中 的 匹配 加 
动作 规则 所 匹配 。 前 面 1. 5.2 节 讲 过 ， 到 达 一 台 分 组 交换 机 的 一 个 链 路 层 〈 第 二 层 ) 帧 将 
包含 一 个 网 络 层 〈 第 三 层 ) 数据 报 作 为 其 有 效 载荷 ， 该 载荷 通常 依次 将 包含 一 个 运输 层 
(第 四 层 ) 报 文 段 。 第 一 个 观察 是 ，OpenFlow 的 匹配 抽象 允许 对 来 自 三 个 层次 的 协议 首部 
所 选择 的 字段 进行 匹配 (因此 相当 勇敢 地 违反 了 我 们 在 1.5 市 中 学 习 的 分 层 原 则 )。 因 为 
我 们 还 没有 涉及 链 路 层 ， 用 如 下 的 说 法 也 就 足够 了 : 显示 在 图 4-29 中 的 源 和 目的 MAC 地 
址 是 与 帧 的 发 送 和 接收 接口 相关 联 的 链 路 层 地 址 ; 通过 基于 以 太 网 地 址 而 不 是 IP 地 址 进 
行 转发 ， 我 们 看 到 OpenFlow 使 能 的 设备 能 够 等 价 于 路 由 需 〈 第 三 层 设 备 ) 转发 数据 报 以 
及 交换 机 (第 二 层 设备 ) 转发 帧 。 以 太 网 类 型 字段 对 应 于 较 高 层 协 议 〈 例 如 IP), ， 利 用 该 
字段 分 解 该 帧 的 载荷 ， 并 且 VLAN 字段 与 所 谓 虚 拟 局 域 网 相关 联 ， 我 们 将 在 第 6 草 中 学 习 
VLAN, OpenFlow 1.0 规范 中 匹配 的 12 个 值 在 最 近 的 OpenFlow 规范 中 已 经 增加 到 41 个 
| Bosshart 2014 | 。 





图 4-29 OpenFlow 1. 0 流 表 的 分 组 匹配 字段 


入 端口 是 指 分 组 交换 机 上 接收 分 组 的 输入 端口 。 在 4.3. 1 节 中 ， 我们 已 经 讨论 过 该 分 
组 的 IP 源 地 址 、IP 目的 地 址 、IP 协议 字段 和 IP 服务 类 型 字段 。 运 输 层 源 和 目的 端口 号 字 
段 也 能 匹配 。 

流 表 项 也 可 以 有 通配符 。 例 如 ， 在 一 个 流 表 中 IP 地 址 128. 119. * . * 将 匹配 其 地 址 的 
前 16 比特 为 128. 119 的 任何 数据 报 所 对 应 的 地 址 字段 。 每 个 流 表 项 也 具有 相应 的 优先 权 。 
如 果 一 个 分 组 匹配 多 个 流 表 项 ， 选 定 的 匹配 和 对 应 的 动作 将 是 其 中 有 最 高 优先 权 的 那个 。 

最 后 ， 我 们 观察 到 并 非 一 个 IP 首部 中 的 所 有 字段 都 能 被 匹配 。 例 如 OpenFlow 并 不 允 
许 基于 TTL 字段 或 数据 报 长 度 字 段 的 匹配 。 为 什么 有 些 字段 允许 匹配 ， 而 有 些 字段 不 允许 
WE? 毫 无 疑问 ， 与 功能 和 复杂 性 有 关 。 选 择 一 种 抽象 的 “艺术 ”是 提供 足够 的 功能 来 完成 
某 种 任务 (在 这 种 情况 下 是 实现 、 配 置 和 管理 宽泛 的 网 络 层 功能 ， 以 前 这 些 一 直 是 通过 各 
种 各 样 的 网 络 层 设备 来 实现 的 ) ， 不 必用 如 此 详尽 和 一 般 性 的 “ 超 负 荷 ” 抽 象 ， 这 种 抽象 
LAZAR SIREN AAS AY FA], Butler Lampson 有 过 著名 的 论述 [Lampson 1983 ] : 

在 一 个 时 刻 做 一 件 事 ， 将 它 做 好 。 一 个 接口 应 当 售 获 一 个 抽象 的 最 低 限 度 的 要 件 。 不 
要 进行 一 般 化 ， 一 般 化 通常 是 错误 的 。 

考虑 到 OpenFlow 的 成 功 ， 人 们 能 够 推测 它 的 设计 者 的 确 很 好 地 选择 了 抽象 技术 。 
OpenFlow 匹配 的 更 多 细节 能 够 在 [OpenFlow 2009; ONF 2016] 中 找到 。 
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4.4.2 动作 


如 图 4-28 中 所 见 ， 每 个 流 表 项 都 有 和 零 个 或 多 个 动作 列表 ， 这 些 动作 决定 了 应 用 于 与 
流 表 项 匹配 的 分 组 的 处 理 。 如 果 有 多 个 动作 ， 它 们 以 在 表 中 规定 的 次 序 执行 。 
其 中 最 为 重要 的 动作 可 能 是 : 
© 转发 。 一 个 人 分 组 可 以 转发 到 一 个 特定 的 物理 输出 端口 ， 广 播 到 所 有 端口 (分 组 到 
达 的 端口 除外 ) ， 或 通过 所 选 的 端口 集合 进行 多 播 。 该 分 组 可 能 被 封装 并 发 送 到 用 
于 该 设备 的 远程 控制 器 。 该 控制 器 则 可 能 (或 可 能 不 ) 对 该 分 组 采取 某 些 动作 ， 
包括 安装 新 的 流 表 项 ， 以 及 可 能 将 该 分 组 返回 给 该 设备 以 在 更 新 的 流 表 规 则 集合 下 
进行 转发 。 
© 丢弃 。 没 有 动作 的 流 表 项 表明 某 个 匹配 的 分 组 应 当 被 丢弃 。 
e 修改 字段 。 在 分 组 被 转发 到 所 选 的 输出 端口 之 前 ， 分 组 首部 10 个 字段 (图 4-29 中 
显示 的 除 IP 协议 字段 外 的 所 有 第 二 、 三 、 四 层 的 字段 ) 中 的 值 可 以 重 写 。 


4.4.3 匹配 加 动作 操作 中 的 OpenFlow 例子 


在 已 经 考虑 了 通用 转发 的 匹配 和 动作 组 件 后 ， 我 们 在 图 4-30 显示 的 样本 网 络 场景 中 
将 这 些 想法 拼装 在 一 起 。 该 网 络 具 有 6 台 主 机 (hl 、h2、h3 、h4 、h5 和 h6) 以 及 3 台 分 
组 交换 机 (sl. s2 和 s3)， 每 台 交 换 机 具有 4 个 本 地 接口 (编号 1 到 4)。 我 们 将 考虑 一 些 
希望 实现 的 网 络 范 围 的 行为 ,在 s1 、s2 和 s3 中 的 流 表 项 需要 实现 这 种 行为 。 


OpenFlow 控 制 器 





图 4-30 具有 3 台 分 组 交换 机 、6 台 主 机 和 1 台 OpenFlow 控制 器 的 OpenFlow 匹配 加 动作 网 络 


第 一 个 例子 : 简单 转发 

作为 一 个 非常 简单 的 例子 ， 假 定 布 望 的 转发 行为 是 : KA hS 或 h6 AEE h3 或 h4 的 分 
组 从 s3 转发 到 sl, RAM sl 转发 到 s2 (完全 避免 使 用 s3 和 s2 之 间 的 链 路 ) 。 在 sl 中 的 
流 表 项 将 是 : 


sl 流 表 ( Bi 1) 
匹配 动作 
Ingress Port =1; IP Src =10.3. *. +; IP Dst=10.2. *. * Forward (4) 
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当然 ， 我 们 也 需要 在 s3 中 有 一 个 流 表 项 ， 使 得 该 数据 报 从 hs 或 h6 经 过 出 接口 3 转发 
到 sl: 
s3 流 表 ( fi) 1) 
匹配 动作 
IP'Sre=10;3. +. * ; IP Dst=10.2. *. # Forward (3) 


最 后 ， 我 们 也 需要 在 s2 中 有 一 个 流 表 项 来 完成 第 一 个 例子 ， 使 得 从 sl 到 达 的 数据 报 
转发 到 它们 的 目的 主机 h3 或 h4。 


s2 流 表 ( 例 1) 
匹配 动作 
Ingress Port =2; IP Dst =10.2.0.3 Forward (3) 
Ingress Port =2; IP Dst=10.2.0.4 Forward (4) 


第 二 个 例子 : 负载 均衡 

作为 第 二 个 例子 ， 我 们 考虑 一 个 负载 均衡 的 场景 ， 其 中 来 目 h3 发 往 10. 1. x. * 的 数 
据 报 经 过 sl 和 s2 之 间 的 直接 链 路 转发 ， 与 此 同时 来 目 h4 发 往 10.1. x. * 的 数据 报 经 过 
s2 和 s3 (于 是 从 s3 到 sl1) 之 间 的 链 路 转发 。 注 意 到 这 种 行为 不 能 通过 基于 IP 的 目的 地 转 
发 取得 。 在 这 种 情况 下 ， 在 s2 中 的 流 表 项 将 是 : 


s2 ize (#2) 
匹配 动作 
Ingress Port =3; IP Dst=10.1. *. * Forward (2) 
Ingress Port =4; IP Dst=10. 1. *. * Forward (1) . | 


在 sl 中 需要 流 表 项 将 从 s2 收 到 的 数据 报 转 发 到 hl 或 2; 在 s3 中 需要 流 表 项 将 接口 
4 上 从 s2 收 到 的 数据 报 经 过 接口 3 转发 到 sl1 。 考 虑 是 否 能 在 sl 和 s3 中 配置 这 些 流 表 项 。 

第 三 个 例子 : 充当 防火 墙 

作为 第 三 个 例子 ， 我 们 考虑 一 个 防火 墙 场景 ， 其 中 s2 仅 希 望 ( 在 它 的 任何 接口 上 ) 
接收 来 自 与 s3 相连 的 主机 所 发 送 的 流量 。 


s2 流 表 〈 例 3) 
匹配 动作 
IP Src =10.3. +. * ; IP Dst=10.2.0.3 Forward (3) 
IP Src =10.3. +. * ; IP Dst =10.2.0.4 Forward (4) 


如 和 在 s2 的 流 表 中 没有 其 他 表 项 ， 则 仅 有 来 目 10. 3. * . * 的 流量 将 被 转发 到 与 s2 相 
连 的 主机 。 

尽管 我 们 这 里 仅 考虑 了 几 种 基本 场景 ， 但 通用 转发 的 多 样 性 和 优势 显而易见 。 在 课 后 
习题 中 ， 我 们 将 探讨 流 表 如 何 用 来 生成 许多 不 同 的 逻辑 行为 ， 包 括 使 用 相同 分 组 交换 机 和 
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链 路 物理 集合 的 虚拟 网 络 ， 即 两 个 或 多 个 逻辑 上 分 离 的 网 络 (每 个 网 络 有 它们 目 己 的 独立 
和 截然 不 同 的 转发 行为 ) 。 在 5.5 市 中 ， 当 学 习 SDN 控制 着 时 ， 我 们 将 再 次 考察 流 表 ， 其 
中 SDN 控制 器 计 算 和 分 发 流 表 ， 协 议 用 于 在 分 组 交换 机 和 人 它 的 控制 项 之 间 进 行 通信 。 


4.5 小 结 


在 本 章 中 ， 我 们 讨论 了 网 络 层 的 数据 平面 (data plane) 功能 ， 即 每 台 路 由 器 的 如 下 
功能 : 决定 到 达 路 由 融 的 输入 链 路 之 一 的 分 组 如 何 转发 到 该 路 由 融 的 输出 链 路 之 一 。 

我 们 从 仔细 观察 路 由 幽 的 内 部 操作 开始 ， 学 习 输 入 和 输出 端口 功能 ， 以 及 基于 目的 地 
的 转发 、 路 由 顺 的 内 部 交换 机 制 、 分 组 排队 管理 等 等 。 我 们 涉及 传统 的 IP 转发 ( 其 中 转 
发 基于 数据 报 的 目的 地 址 进行 ) 和 通用 转发 〈 其 中 转发 和 其 他 功能 可 以 使 用 数据 报 首 部 中 
的 几 个 不 同 的 字段 值 来 进行 ) ， 并 且 看 到 了 后 一 种 方法 的 多 种 用 途 。 我 们 还 详细 地 学 习 了 
IPv4 和 IPv6 协议 以 及 因特网 编 址 ， 并 对 此 有 了 更 深入 、 更 敏锐 和 更 有 趣 的 发 现 。 

借助 于 新 得 到 的 对 网 络 层 数 据 平面 的 理解 ， 我 们 现在 准备 着 手 学 习 第 5 章 中 的 网 络 层 
控制 平面 。 


课 后 习题 和 问题 





4.1 节 

RI. 我 们 回顾 在 本 书 中 使 用 的 某 些 术 语 。 前 面 讲 过 运输 层 的 分 组 名 字 是 报 文 段 ， 数 据 链 路 层 的 分 组 名 字 
是 帧 。 网 络 层 的 分 组 名 字 是 什么 ? 前 面 讲 过 路 由 器 和 链 路 层 交 换 机 都 被 称 为 分 组 交换 机 - 路 由 器 与 
链 路 层 交 换 机 间 的 根本 区 别 是 什么 ? 

R2. 我 们 注意 到 网 络 层 功能 可 被 大 体 分 成 数据 平面 功能 和 控制 平面 功能 。 数 据 平 面 的 主要 功能 是 什么 ? 
控制 平面 的 主要 功能 呢 ? 

R3. 我 们 对 网 络 层 执行 的 转发 功能 和 路 由 选择 功能 进行 区 别 。 路 由 选择 和 转发 的 主要 区 别 是 什么 ? 

R4. 路 由 器 中 转发 表 的 主要 作用 是 什么 ? 

RS. 我 们 说 过 网 络 层 的 服务 模型 “定义 发 送 主机 和 接收 主机 之 间 端 到 端 分 组 的 传送 特性 ” 。 因 特 网 的 网 
络 层 的 服务 模型 是 什么 ?就 主机 到 主机 数据 报 的 传递 而 论 ， 因 特 网 的 服务 模型 能 够 保证 什么 ? 

4.25 

R6. 在 4.2 节 中 ， 我 们 看 到 路 由 器 通常 由 输入 端口 、 输 出 端口 、 交 换 结 构 和 路 由 选择 处 理 需 组 成 。 其 中 
哪些 是 用 硬件 实现 的 ， 哪 些 是 用 软件 实现 的 ? 为 什么 ? 转 到 网 络 层 的 数据 平面 和 控制 平面 的 概念 ， 
哪些 是 用 硬件 实现 的 ， 哪 些 是 用 软件 实现 的 ”为 什么 ? 

R7. 讨论 为 什么 在 高 速 路 由 器 的 每 个 输入 端口 都 存储 转发 表 的 影子 副本 。 

R8. 基于 目的 地 转发 意味 着 什么 ”这 与 通用 转发 有 什么 不 同 (假定 你 已 经 阅读 4.4 节 ， 两 种 方法 中 哪 种 
是 软件 定义 网 络 所 采用 的 )? 

R9. 假设 一 个 到 达 分 组 匹配 了 路 由 器 转发 表 中 的 两 个 或 更 多 表 项 。 采 用 传统 的 基于 目的 地 转发 ， 路 由 需 
用 什么 原则 来 确定 这 条 规则 可 以 用 于 确定 输出 端口 ， 使 得 到 达 的 分 组 能 交换 到 输出 端口 ? 

R10. Æ 4.2 节 中 讨论 了 三 种 交换 结构 。 列 出 并 简要 讨论 每 一 种 交换 结构 。 哪 一 种 ( 如 果 有 的 话 ) 能 够 跨 
越 交换 结构 并 行 发 送 多 个 分 组 ? 

R11. 描述 在 输入 端口 会 出 现 分 组 丢失 的 原因 。 描 述 在 输入 端口 如 何 消除 分 组 丢失 (不 使 用 无 限 大 缓存 区 ) . 

R12. 描述 在 输出 端口 会 出 现 分 组 丢失 的 原因 。 通 过 提高 交换 结构 速率 ， 能 够 防止 这 种 丢失 吗 ? 

R13. 什么 是 HOL PAE? 它 出 现在 输入 端口 还 是 输出 端口 ? 
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R14. 在 4.2 节 我 们 学 习 了 FIFO、 优 先 权 、 循 环 (RR) 和 加 权 公 平 排队 (WFO) 分 组 调度 规则 。 这 些 排 
队 规则 中 ， 哪 个 规则 确保 所 有 分 组 是 以 到 达 的 次 序 离开 的 ? 

R15. 举例 说 明 为 什么 网 络 操作 员 要 让 一 类 分 组 的 优先 权 超 过 另 一 类 分 组 的 。 

R16. RR 和 WFQ 分 组 调度 之 间 的 基本 差异 是 什么 ? 存在 RR 和 WFQ 将 表现 得 完全 相同 的 场合 吗 ? (提示 : 
考虑 WFO 权重 。) 

4.3% 

R17. 假定 主机 A 向 主机 B 发 送 封装 在 一 个 P 数据 报 中 的 TCP 报 文 段 。 当 主机 B 接收 到 该 数据 报时 ， 主 
机 B 中 的 网 络 层 怎 样 知道 它 应 当 将 该 报 文 段 ( 即 数 据 报 的 有 效 载 荷 ) 交 给 TCP 而 不 是 UDP 或 某 个 
其 他 东西 呢 ? 

R18. 在 了 首部 中 ， 哪 个 字段 能 用 来 确保 一 个 分 组 的 转发 不 超过 N 台 路 由 器 ? 

R19. 前 面 讲 过 因特网 检验 和 被 用 于 运输 层 报 文 段 (分 别 在 图 3-7 和 图 3-29 的 UDP 和 TCP 首部 中 ) 以 及 
网 络 层 数据 报 (图 4-16 的 卫 首 部 中 ) 。 现 在 考虑 一 个 运输 层 报 文 段 封装 在 一 个 P 数据 报 中 。 在 报 
文 段 首部 和 数据 报 首部 中 的 检验 和 要 遍及 IP 数据 报 中 的 任何 共同 字 节 进行 计算 吗 ? 

R20. 什么 时 候 一 个 大 数据 报 分 割 | 成 多 个 较 小 的 数据 报 ? 较 小 的 数据 报 在 什么 地 方 装配 成 一 个 较 大 的 数据 报 ? 

R21. 路 由 器 有 IP 地 址 吗 ? 如 果 有 ， 有 和 多少 个 ? 

R22. IP 地 址 223. 1.3.27 的 32 比特 二 进 制 等 价 形式 是 什么 ? 

R23. 考察 使 用 DHCP 的 主机 ， 获 取 它 的 全 地址、 网 络 掩 码 、 默 认 路 由 器 及 其 本 地 DNS 服务 器 的 全 地 
址 。 列 出 这 些 值 。 

R24. 假设 在 一 个 源 主 机 和 一 个 目的 主机 之 间 有 3 台 路 由 器 。 不 考虑 分 片 ， 一 个 从 源 主 机 发 送 给 目的 主机 
的 IP 数据 报 将 通过 多 少 个 接口 ? 为 了 将 数据 报 从 源 移 动 到 目的 地 需要 检索 多 少 个 转发 表 ? 

R25. 假设 某 应 用 每 20ms 生成 一 个 40 字 节 的 数据 块 ， 每 块 封装 在 一 个 TCP 报 文 段 中 ，TCP 报 文 段 再 封装 
在 一 个 卫 数 据 报 中 。 每 个 数据 报 的 开销 有 多 大 ? 应 用 数据 所 占 百 分 比 是 多 少 ? 

R26. 假定 你 购买 了 一 个 无 线路 由 器 并 将 其 与 电缆 调制 解 调 器 相连 。 同 时 假定 ISP 动态 地 为 你 连接 的 设备 
( 即 你 的 无 线路 由 器 ) 分 配 一 个 IP 地 址 。 还 假定 你 家 有 5 台 PC， 均 使 用 802. 11 以 无 线 方式 与 该 无 
线路 由 器 相连 。 怎 样 为 这 S 台 PC 分 配 IP 地 址 ? 该 无 线路 由 器 使 用 NAT 吗 ? 为 什么 ? 

R27. “路 由 聚合 ”一 词 意味 着 什么 ?路 由 器 执行 路 由 聚合 为 什么 是 有 用 的 ? 

R28. “ 即 插 即 用 ”或 “ 零 配置 ”协议 意味 着 什么 ? 

R29. 什么 是 专用 网 络 地 址 ? 具有 专用 网 络 地 址 的 数据 报 会 出 现在 大 型 公共 因特网 中 吗 ? 解释 理由 。 

R30. 比较 并 对 照 IPv4 和 IPv6 首部 字段 。 它 们 有 相同 的 字段 吗 ? 

R31. 有 人 说 当 IPv6 以 隧道 形式 通过 IPv4 路 由 器 时 ，IPvw6 将 IPv4 隧道 作为 链 路 层 协 议 。 你 同意 这 种 说 法 
吗 ? 为 什么 ? 

4.4 节 

R32. 通用 转发 与 基于 目的 地 转发 有 何不 同 ? 

R33. 我 们 在 4. 1 节 遇 到 的 基于 目的 地 转发 与 在 4. 4 节 遇 到 的 OpenFlow 流 表 之 间 有 什么 差异 ? 

R34. 路 由 器 或 交换 机 的 “匹配 加 动作 ”意味 着 什么 ? 在 基于 目的 地 转发 的 分 组 交换 机 场合 中 ， 要 匹配 什 
么 并 采取 什么 动作 ? 在 SDN 的 场合 中 ， 举 出 3 个 能 够 被 匹配 的 字段 和 3 个 能 被 采取 的 动作 。 

R35. 在 IP 数 据 报 中 举 出 能 够 在 OpenFlow 1. 0 通用 转发 中 “匹配 ”的 3 个 首部 字段 。 不 能 在 OpenFlow 中 
“匹配 ”的 3 个 卫 数 据 报 首部 字段 是 什么 ? 


习题 


Pl. 考虑 下 面 的 网 络 。 
a. 显示 路 由 器 A 中 的 转发 表 ， 使 得 目的 地 为 主机 H3 的 所 有 流量 都 通过 接口 3 转发 。 
b 写 出 路 由 器 A 中 的 转发 表 ， 使 得 从 Hl 发 往 主机 H3 的 所 有 流量 都 通过 接口 3 转发 ， 从 H2 REE 
机 H3 的 所 有 流量 都 通过 接口 4 转发 。( 提示: 这 是 一 个 技巧 性 的 问题 。) 


PZ; 


P4. 


238 #4ËŽ 





假设 两 个 分 组 在 完全 相同 的 时 刻 到 达 一 台 路 由 需 的 两 个 不 同 输入 端口 。 同 时 假设 在 该 路 由 器 中 没有 
其 他 分 组 。 

a. 假设 这 两 个 分 组 朝 着 两 个 不 同 的 输出 端口 转发 。 当 交换 结构 使 用 一 条 共享 总 线 时 ， 这 两 个 分 组 可 
能 在 相同 时 刻 通过 该 交换 结构 转发 吗 ? 

. 假设 这 两 个 分 组 朝 着 两 个 不 同 的 输出 端口 转发 。 当 交换 结构 使 用 经 内 存 交 换 时 ， 这 两 个 分 组 可 能 
在 相同 时 刻 通 过 该 交换 结构 转发 吗 ? 

c. 假设 这 两 个 分 组 朝 着 相同 的 输出 端口 转发 。 当 交换 结构 使 用 纵横 式 时 ， 这 两 个 分 组 可 能 在 相同 时 
刻 通 过 该 交换 结构 转发 吗 ? 


o” 


. 在 4.2 节 中 ,我 们 注意 到 如 果 交 换 结构 速率 是 输入 线路 速率 的 n 倍 ， 其 最 大 的 排队 时 延 为 (n-1)D, 


假设 所 有 分 组 有 相同 长 度 ， 在 相同 时 刻 n 个 分 组 到 达 个 输出 端口 ， 同 时 所 有 个 分 组 要 转发 到 不 
同 的 输出 端口 。 对 于 内 存 、 总 线 和 纵横 式 交换 结构 ， 一 个 分 组 的 最 大 时 延 是 多 少 ? 

考虑 下 列 交换 机 。 假 设 所 有 数据 报 具 有 相同 长 度 ， 交 换 机 以 一 种 分 时 际 、 同 步 的 方式 运行 ， 在 一 个 
时 隙 中 一 个 数据 报 能 够 从 某 输入 端口 传送 到 某 输出 端口 。 其 交换 结构 是 纵横 式 的 ， 因 此 在 一 个 时 辽 
中 至 多 一 个 数据 报 能 够 传送 到 一 个 给 定 输 出 端口 ， 但 在 一 个 时 际 中 不 同 的 输出 端口 能 够 接收 到 来 自 
不 同 输入 端口 的 数据 报 ， 从 输入 端口 到 它们 的 输出 端口 传送 所 示 的 分 组 ， 所 需 的 时 际 数量 最 小 是 多 
少 ? 此 时 假定 使 用 你 所 需要 的 任何 输入 排队 调度 方法 〈 即 此 时 没有 HOL 阻塞 ) 。 假 定 采 用 你 能 够 设 
计 的 最 差 情 况 下 的 调度 方案 ， 且 非 空 输入 队列 不 会 空 亲 ， 所 需 的 时 辽 数 量 最 大 是 多 少 ? 


-0 ] [ | 输出 端 DX 一 > 
一 | 交换 结构 “上 -输出 端 BY — 


-| a — 
. 考虑 使 用 32 比特 主机 地 址 的 某 数 据 报 网 络 。 假 定 一 台 路 由 器 具有 4 条 链 路 ， 编 号 为 0 ~3， 分 组 能 被 
转发 到 如 下 的 各 链 路 接口 : 
目的 地 址 范围 链 路 接口 
11100000 00000000 00000000 00000000 
到 0 


11100000 00111111 11111111 11111111 
11100000 01000000 00000000 00000000 

到 l 
11100000 01000000 11111111 11111111 
11100000 01000001 00000000 00000000 

到 | 2 
11100001 01111111 11111111 11111111 


其 他 3 


P8. 


P9. 
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a 提供 一 个 具有 5 个 表 项 的 转发 表 ， 使 用 最 长 前 缀 匹配 ， 转 发 分 组 到 正确 的 链 路 接口 。 
b 描述 你 的 转发 表 是 如 何 为 具有 下 列 目的 地 址 的 数据 报 决定 适当 的 链 路 接口 的 。 
11001000 10010001 01010001 01010101 


11100001 01000000 11000011 00111100 
11100001 10000000 00010001 01110111 


. 考虑 使 用 8 比特 主机 地 址 的 某 数 据 报 网 络 。 假 定 一 台 路 由 器 使 用 最 长 前 缀 匹配 并 具有 下 列 转发 表 : 
前 缀 匹配 接口 
00 


对 这 4 个 接口 中 的 每 个 ， 给 出 相应 的 目的 主机 地 址 的 范围 和 在 该 范围 中 的 地 址 数量 。 


. 考虑 使 用 8 比特 主机 地 址 的 数据 报 网 络 。 假 定 一 台 路 由 器 使 用 最 长 前 缀 匹配 并 具有 下 列 转发 表 : 
前 缀 匹配 接口 
1 0 
10 1 
111 2 
其 他 3 


对 这 4 个 接口 中 的 每 个 ， 给 出 相应 的 目的 主机 地 址 的 范围 和 在 该 范围 中 的 地 址 数量 。 

考虑 互联 3 个 子 网 ( 子 网 1、 子 网 2 和 子 网 3) 的 一 台 路 由 器 。 假 定 这 3 个 子 网 的 所 有 接口 要 求 具有 
HU SR 223. 1. 17/24。 还 假定 子 网 1 要 求 支持 多 达 60 个 接口 ， 子 网 2 要 求 支 持 多 达 90 个 接口 ， 子 网 3 
要 求 支持 多 达 12 个 接口 。 提 供 3 个 满足 这 些 限制 的 网 络 地 址 (形式 为 a. b. c. d/x)。 

在 4.2.2 节 中 给 出 了 一 个 转发 表 〈 使 用 最 长 前 缀 匹配 ) 的 例子 。 使 用 a. b. c d/x 记 法 代替 二 进 制 字符 
串 记 法 ， 重 写 该 转发 表 。 


P10. 在 习题 P5 中 要 求 你 给 出 转发 表 (使 用 最 长 前 缀 匹配 ) 。 使 用 abc. d/x 记 法 代替 二 进 制 字符 串 记 


P11. 


P12. 


P13: 


P14. 


法 ， 重 写 该 转发 表 。 

考虑 一 个 具有 前 128. 119. 40. 128/26 的 子 网 。 给 出 能 被 分 配给 该 网 络 的 一 个 IP 地 址 (形式 为 

XXX. xxx. xxx. xxx) 的 例子 。 假 定 一 个 ISP 拥有 形式 为 128. 119. 40. 64/26 的 地 址 块 。 假 定 它 要 从 该 地 

址 块 生成 4 个子 网 ， 每 块 具 有 相同 数量 的 人 P 地址 。 这 4 个子 网 (形式 为 a. b. c. d/x) 的 前 缀 是 什么 ? 

考虑 图 4-20 中 显示 的 拓扑 。( 在 12:00 以 顺 时 针 开 始 ) 标记 具有 主机 的 3 个 子 网 为 网 络 A、B 和 C， 

标记 没有 主机 的 子 网 为 网 络 D、EE 和 下 。 

a 为 这 6 个 子 网 分 配 网 络 地 址 ， 要 满足 下 列 限制 : 所 有 地 址 必须 从 214. 97. 254/23 起 分 配 ; 子 网 A 
应 当 具 有 足够 地 址 以 支持 250 个 接口 ; 子 网 B 应 当 具 有 足够 地 址 以 支持 120 个 接口 ; FA C 应 当 
具有 足够 地 址 以 支持 120 个 接口 。 当 然 ， 子 网 D、E 和 下 应 当 支 持 两 个 接口 。 对 于 每 个 子 网 ， 分 
配 采 用 的 形式 是 a. b. c. d/x X a. b. c. d/x ~e. f. g. h/yo 

b. 使 用 你 对 (a) 部 分 的 答案 ， 为 这 3 台 路 由 器 提供 转发 表 (使 用 最 长 前 缀 匹配 ) 。 

使 用 美国 因特网 编码 注册 机 构 (http://www. arin. net/whois) 的 whois 服务 来 确定 三 所 大 学 所 用 的 IP 

地 址 块 。whois 服务 能 被 用 于 确定 某 个 特定 的 IP 地 址 的 确定 地 理 位 置 吗 ? 使 用 www. maxmind. com 来 

确定 位 于 这 三 所 大 学 的 Web 服务 器 的 位 置 。 

考虑 向 具有 700 字 节 MTU 的 一 条 链 路 发 送 一 个 2400 字 节 的 数据 报 。 假 定 初始 数据 报 标 有 标识 号 

422。 将 会 生成 多 少 个 分 片 ? 在 生成 相关 分 片 的 数据 报 中 各 个 字段 的 值 是 多 少 ? 
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PIS. 


P16. 


Pid, 


P18. 


P19. 


P20. 


P22. 


假定 在 源 主机 A 和 目的 主机 B 之 间 的 数据 报 被 限制 为 1500 字 节 (包括 首部 ) 。 假 设 耳 首部 为 20 F 

节 ， 要 发 送 一 个 5MB 的 MP3 文件 需要 多 少 个 数据 报 ? 解释 你 的 答案 是 如 何 计算 的 。 

考虑 在 图 4-25 中 建立 的 网 络 。 假 定 ISP 现在 为 路 由 器 分 配 地 址 24. 34. 112. 235 ， 家 庭 网 络 的 网 络 地 

址 是 192. 168. 1/24, 

a. 在 家 庭 网 络 中 为 所 有 接口 分 配 地 址 。 

b. 假定 每 台 主 机 具有 两 个 进行 中 的 TCP 连接 ， 所 有 都 是 针对 主机 128. 119. 40. 86 的 80 端口 的 。 在 
NAT 转换 表 中 提供 6 个 对 应 表 项 。 

假设 你 有 兴趣 检测 NAT 后 面 的 主机 数量 。 你 观察 到 在 每 个 卫 分 组 上 IP 层 顺序 地 标 出 一 个 标识 号 。 

由 一 台 主 机 生成 的 第 一 个 IP 分 组 的 标识 号 是 一 个 随机 数 ， 后 继 IP 分 组 的 标识 号 是 顺序 分 配 的 。 假 

设 由 NAT 后 面 主 机 产生 的 所 有 IP 分 组 都 发 往外 部 。 

a. 基于 这 个 观察 ， 假 定 你 能 够 俘获 由 NAT 向 外 部 发 送 的 所 有 分 组 ， 你 能 概要 给 出 一 种 简单 的 技术 
来 检测 NAT 后 面 不 同 主机 的 数量 吗 ? 评估 你 的 答案 。 

b. 如 果 标 识 号 不 是 顺序 分 配 而 是 随机 分 配 的 ， 这 种 技术 还 能 正常 工作 吗 ? 评估 你 的 答案 。 

在 这 个 习题 中 ， 我 们 将 探讨 NAT 对 P2P 应 用 程序 的 影响 。 假 定 用 户 名 为 Arnold 的 对 等 方 通过 查询 

发 现 ， 用 户 名 为 Bernard 的 对 等 方 有 一 个 要 下 载 的 文件 。 同 时 假定 Bernard 和 Arnold 都 位 于 NAT 后 
。 尝 试 设计 一 种 技术 ， 使 得 Arnold 与 Bernard 创建 一 条 TCP 连接， 而 不 对 NAT 做 应 用 特定 的 配 

置 。 如 果 难 以 设计 这 样 的 技术 ， 试 讨论 其 原因 。 

考虑 显示 在 图 4-30 中 的 SDN OpenFlow 网 络 。 假 定 对 于 到 达 s2 的 数据 报 的 期 望 转发 行为 如 下 : 

o 来 自主 机 hs 或 h6 并 且 发 往 主机 hl 或 h2 的 任何 数据 报应 当 通过 输出 端口 2 转发 到 输入 端口 1。 

o 来 自主 机 hl 或 h2 并 且 发 往 主机 hs 或 h6 的 任何 数据 报应 当 通过 输出 端口 1 转发 到 输入 端口 2。 

o 任何 在 端口 1 或 2 到 达 并 且 发 往 主机 h3 或 h4 的 数据 报应 当 传 递 到 特定 的 主机 。 

© 主机 h3 和 h4 应 当 能 够 向 彼此 发 送 数 据 报 。 

详 述 实现 这 种 转发 行为 的 s2 中 的 流 表 项 。 

再 次 考虑 显示 在 图 4-30 中 的 SDN OpenFlow 网 络 。 假 定 在 s2 对 于 来 自主 机 h3 或 h4 的 数据 报 的 期 望 

转发 行为 如 下 : 

o 任何 来 自主 机 h3 并 且 发 往 主机 hl h2, 、hs 或 h6 的 数据 报应 当 在 网 络 中 以 顺 时 针 方向 转发 。 

o 任何 来 自主 机 h4 并 且 发 往 主 机 hl 、h2 、hs 或 h6 的 数据 报应 当 在 网 络 中 以 道 时针 方 向 转发 。 

详 述 实现 这 种 转发 行为 的 s2 中 的 流 表 项 。 


. 再 次 考虑 上 面 P19 的 场景 。 给 出 分 组 交换 机 sl 和 s3 的 流 表 项 ， 使 得 具有 h3 或 h4 源 地 址 的 任何 到 


达 数 据 报 被 路 由 到 在 IP 数据 报 的 目的 地 址 字段 中 定义 的 目的 主机 。( 提 示 : 你 的 转发 表 规则 应 当 包 

括 如 下 情况 ， 即 到 达 的 数据 报 被 发 往 直 接连 接 的 主机 ， 或 应 当 转 发 到 相 邻 路 由 右 以 便 传 递 到 最 终 

主机 。) 

再 次 考虑 显示 在 图 4-30 中 的 SDN OpenFlow 网 络 。 假 定 我 们 希望 交换 机 s2 的 功能 像 防火 墙 一 样 。 在 

s2 中 定义 实现 下 列 防火 墙 行为 的 流 表 ， 以 传递 目的 地 为 h3 和 h4 的 数据 报 (对 下 列 四 种 防火 墙 行 

为 ， 每 种 定义 一 张 不 同 的 流 表 ) 。 不 需要 在 s2 中 定义 将 流量 转发 到 其 他 路 由 器 的 转发 行为 。 

© 仅 有 从 主机 hl 和 h6 到 达 的 流量 应 当 传递 到 主机 h3 或 h4 ( 即 从 主机 h2 和 hs 到 达 的 流量 被 阻 
塞 ) 。 

© {LA TCP 流量 被 允许 传递 给 主机 h3 或 4 (BI UDP 流量 被 阻塞 ) 。 

© 仅 有 发 往 h3 的 流量 被 传递 ( 即 所 有 到 h4 的 流量 被 阻塞 ) 。 

e (AKA hl 并 且 发 往 h3 的 UDP 流量 被 传递 。 所 有 其 他 流量 被 阻塞 。 


Cy Wireshark 实验 


在 与 本 书 配套 的 Web 站 点 www. pearsonhighered. com/cs-resources 上 ， 你 将 找到 一 个 Wireshark 实验 作 


W, ELEZ T IP 协议 的 运行 ,特别 是 IP 数据 报 的 格式 。 
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Vinton G. Cerf 是 Internet Evangelist for Google 公司 的 副 总 裁 儿 主席。 他 在 
MCI 公司 服务 了 16 年 ， 担 任 过 各 种 职位 ， 最 后 以 技术 战略 部 资深 副 总 裁 的 
身份 结束 了 他 在 那里 的 任期 。 他 作为 TCP/IP 协议 和 因特网 体系 结构 的 共同 
设计 者 而 广为人知 。1976 年 到 1982 年 在 美国 国防 部 高 级 研究 计划 署 (DAR- 
PA) 任职 期 间 ， 他 在 领导 因特网 以 及 与 因特网 相关 的 数据 分 组 和 安全 技术 
的 研发 方面 发 挥 了 重要 作用 。 他 于 2005 年 获得 了 美国 总 统 自 由 奖章 ， 于 
1977 年 获得 了 美国 国家 技术 奖章 。 他 在 斯 坦 福 大 学 获得 数学 学 士 学 位 ， 在 加 
利 福 尼 亚 大 学 洛杉矶 分 校 (UCLA) 获得 了 计算 机 科学 的 硕士 和 博士 学 位 。 





。 是 什么 使 您 专注 于 网 络 技 术 的 呢 ? Vea Ses eit 

20 世纪 60 年 代 未 ， 我 在 UCLA 一 直 做 程序 员 的 工作 。 我 的 工作 得 到 了 美国 国防 部 高 级 研究 计划 署 
( 那 时 叫 ARPA ， 现 在 叫 DARPA) 的 支持 。 我 那 时 在 刚 创 建 不 久 的 ARPAnet 的 网 络 测量 中 心 ， 为 Leonard 
Kleinrock 教授 的 实验 室 工 作 。ARPAnet 的 第 一 个 节点 于 1969 年 9 月 1 日 安装 在 UCLA。 我 负责 为 计算 机 
编程 ， 以 获取 有 关 ARPAnet 的 性 能 信息 ， 并 报告 这 些 信息 以 便 与 数学 模型 作 比 较 ， 预 测 网 络 性 能 。 

我 和 其 他 几 名 研究 生 负 责 研制 所 谓 的 ARPAnet 主机 级 协议 ,该 协议 的 过 程 和 格式 将 使 得 网 络 中 许多 
不 同类 型 的 计算 机 相互 交互 。 这 是 我 进入 分 布 式 计算 与 通信 新 世界 中 的 一 次 迷人 的 探索 。 

© 当 您 第 一 次 设计 该 协议 时 ， 您 曾 想 象 过 IP 会 像 今天 这 样 变 得 无 所 不 在 吗 ? 

当 我 和 Bob Kahn 于 1973 年 最 初 从 事 该 项 工作 时 ， 我 想 我 们 的 注意 力 大 多 集中 在 这 样 一 个 重要 的 问 
题 上 : 假定 我 们 不 能 实际 改变 这 些 网 络 本 身 ， 那 么 怎样 才能 让 异 构 的 分 组 网 络 彼 此 互 操作 呢 ? 我 们 希望 
能 找到 一 种 方法 可 以 使 任意 多 的 分 组 交换 网 以 透明 的 方式 进行 互联 ， 以 便 主机 彼此 之 间 不 做 任何 转换 就 
能 进行 端 到 端 通信 。 我 认为 我 们 那 时 已 经 知道 了 我 们 正在 处 理 强大 的 和 可 扩充 的 技术 ， 但 还 没 清楚 地 想 
过 有 数 亿 台 计 算 机 都 连 人 因特网 时 的 世界 会 是 什么 样 。 

。 您 现在 能 预见 网 络 与 因特网 的 未 来 吗 ? 您 认为 在 它们 的 发 展 中 存在 的 最 大 挑战 或 障碍 是 什么 ? 

我 相信 因特网 本 身 以 及 一 般 的 网 络 都 将 要 继续 扩大 。 已 有 令 人 信服 的 证 据 表 明 ， 在 因特网 上 将 有 数 
二 亿 个 因特网 使 能 设备 ， 包 括 移动 电话 、 冰 箱 、 个 人 数字 助理 、 家 用 服务 器 、 电 视 等 家 用 电器 ， 以 及 大 
批 通常 的 便携 机 、 服 务 器 等 。 重 大 挑战 包括 支持 移动 性 、 电 池 寿 命 、 网 络 接 入 链 路 的 容量 、 以 不 受 限 的 
方式 扩展 网 络 光学 核心 的 能 力 。 设 计 因 特 网 的 星际 扩展 是 我 在 喷气 推进 实验 室 深入 研究 的 一 项 计划 。 我 
们 需要 从 IPv4 (32 比特 地 址 ) 过 渡 到 IPv6 (128 比特 ) 。 要 做 的 事情 实在 是 太 多 了 ! 

© 是 谁 激发 了 您 的 职业 灵感 ? 

我 的 同事 Bob Kahn、 我 的 论文 导师 Gerald Estrin, FR Ae AY AAA Steve Crocker (我 们 在 高 中 就 认识 
T, 1960 年 是 他 带 我 进入 了 计算 机 学 科 之 门 !) ， 以 及 数 千 名 今天 仍 在 继续 推动 因特网 发 展 的 工程 师 。 

© 您 对 进入 网 络 / 因 特 网 领域 的 学 生 有 什么 忠告 吗 ? 

要 跳出 现 有 系统 的 限制 来 思考 问题 ， 想 一 想 什 么 是 可 行 的 ; 随后 再 做 艰苦 工作 以 谋划 如 何 从 事物 的 
当前 状态 到 达 所 想 的 状态 。 要 敢于 想象 : 我 和 喷气 推进 实验 室 的 6 个 同事 一 直 在 从 事 陆地 因特网 的 星际 
扩展 设计 。 这 也 许 要 花 几 十 年 才能 实现 ， 任 务 会 一 个 接着 一 个 地 出 现 ， 可 以 用 这 和 句 话 来 总 结 : “一 个 人 
总 是 要 不 断 地 超越 自我 ， 否 则 还 有 什么 乐趣 可 言 ?” 
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网 络 层 : ”控制 平面 





在 本 章 中 ， 我 们 将 通过 包含 网 络 层 的 控制 平面 组 件 来 完成 我 们 的 网 络 层 之 旅 。 控 制 平 
面 作为 一 种 网 络 范围 的 逻辑 ， 不 仅 控制 沿 着 从 源 主机 到 目的 主机 的 端 到 端 路 径 间 的 路 由 器 
如 何 转发 数据 报 ， 而 且 控制 网 络 层 组 件 和 服务 如 何 配置 和 管理 。 在 5. 2 节 中 ， 我 们 将 包含 
传统 的 计算 图 中 最 低 开 销路 径 的 路 由 选择 算法 。 这 些 算 法 是 两 个 广 为 部 署 的 因特网 路 由 选 
择 协议 OSPF 和 BGP 的 基础 ， 我 们 将 分 别 在 5.3 节 和 5.4 节 中 涉及 。 如 我 们 将 看 到 的 那 
E, OSPF 是 一 种 运行 在 单一 ISP 的 网 络 中 的 路 由 选择 算法 。BCP 是 一 种 在 因特网 中 用 于 
互联 所 有 网 络 的 路 由 选择 算法 ， 因 此 常 被 称 为 因特网 的 “黏合 剂 ” 。 传 统 上 ， 控 制 平面 功 
能 与 数据 平面 的 转发 功能 在 一 起 实现 ， 在 路 由 器 中 作为 统一 的 整体 。 如 我 们 在 第 4 章 所 学 
习 的 那样 ， 软 件 定义 网 络 (SDN) 在 数据 平面 和 控制 平面 之 间 做 了 明确 分 割 ， 在 一 台 分 离 
的 “控制 占 ” 服 务 中 实现 了 控制 平面 功能 ， 该 控制 右 服 务 与 它 所 控制 的 路 由 融 的 转发 组 件 
完全 分 开 并 远离 。 我 们 将 在 5.5 节 中 讨论 SDN 控制 器 。 

在 5.6 节 和 5.7 PP, 我们 将 涉及 管理 IP 网 络 的 某 些 具体 细节 : ICMP (互联 网 控制 
报 文 协议 ) 和 SNMP (简单 网 络 管理 协议 )。 


5.1 概述 


我 们 通过 回顾 图 4-2 和 图 4-3， 迅 速 建立 起 学 习 网 络 控制 平面 的 环境 。 在 这 里 ， 我 们 
看 到 了 转发 表 (在 基于 目的 地 转发 的 场景 中 ) MARK (在 通用 转发 的 场景 中 ) 是 链接 网 
络 层 的 数据 平面 和 控制 平面 的 首要 元 素 。 我 们 知道 这 些 表 定 义 了 一 台 路 由 器 的 本 地 数据 平 
面 转发 行为 。 我 们 看 到 在 通用 转发 的 场景 下 ， 所 采取 的 动作 (4.4.2 节 ) 不 仅 包括 转发 一 
个 分 组 到 达 路 由 器 的 每 个 输出 端口 ， 而 且 能 够 丢弃 一 个 分 组 、 复 制 一 个 分 组 和 /或 重 写 第 
2、3 或 4 层 分 组 首部 字段 。 
在 本 章 中 ， 我 们 将 学 习 这 些 转发 表 和 流 表 是 如 何 计 算 、 维 护 和 安装 的 。 在 4.1 节 的 网 
络 层 概 述 中 ， 我 们 已 经 学 习 了 完成 这 些 工作 有 两 种 可 能 的 方法 。 
e 每 路 由 器 控制 。 图 5-1 显示 了 在 每 台 路 由 器 中 运行 一 种 路 由 选择 算法 的 情况 ， 每 台 
路 由 器 中 都 包含 转发 和 路 由 选择 功能 。 每 台 路 由 器 有 一 个 路 由 选择 组 件 ， 用 于 与 其 
他 路 由 器 中 的 路 由 选择 组 件 通信 ， 以 计算 其 转发 表 的 值 。 这 种 每 路 由 器 控制 的 方法 
在 因特网 中 已 经 使 用 了 几 十 年 。 将 在 5.3 节 和 5.4 节 中 学 习 的 OSPF 和 BGP 协议 都 
是 基于 这 种 每 路 由 器 的 方法 进行 控制 的 。 
o 过 辑 集中 式 控制 。 图 5-2 显示 了 逻辑 集中 式 控 制 器 计算 并 分 发 转发 表 以 供 每 台 路 由 
器 使 用 的 情况 。 如 我 们 在 4. 4 节 中 所 见 ， 通用 的 “匹配 加 动作 ”抽象 允许 执行 传统 
W IP 转发 以 及 其 他 功能 (负载 共享 、 防 火 墙 功 能 和 NAT) 的 丰富 集合 ， 而 这 些 功 
能 先前 是 在 单独 的 中 间 盒 中 实现 的 。 
该 控制 器 经 一 种 定义 良好 的 协议 与 每 台 路 由 器 中 的 一 个 控制 代理 (CA) 进行 交互 ， 
以 配置 和 管理 该 路 由 器 的 转发 表 。CA 一 般 具 有 最 少 的 功能 ， 其 任务 是 与 控制 器 通信 并 且 
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按 控 制 器 命令 行事 。 与 图 5-1 中 的 路 由 选择 算法 不 同 ， 这 些 CA 既 不 能 直接 相互 交互 ， 也 
不 能 主动 参与 计算 转发 表 。 这 是 每 路 由 器 控制 和 逻辑 集中 式 控 制 之 间 的 关键 差异 。 


5T = 
oS : 








图 5-2 逻辑 集中 式 控制 : 一 个 完全 分 开 的 (通常 是 远 地 的 ) 控制 器 与 本 地 控制 代理 交互 


“逻辑 集中 式 ”控制 [Levin 2012] 意味 着 就 像 路 由 选择 控制 服务 位 于 单一 的 集中 服务 点 
那样 获取 它们 ， 即 使 该 服务 出 于 容错 和 性 能 扩展 性 的 原因 ， 很 可 能 经 由 多 个 服务 器 实现 。 正 
如 我 们 将 在 5. 5 节 中 所 见 ，SDN 采用 了 逻辑 集中 式 控制 器 的 概念 ， 而 这 种 方法 在 生产 部 署 中 
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得 到 了 越 来 越 多 的 应 用 。 谷 歌 在 它 的 内 部 B4 全 球 广 域 网 中 使 用 了 SDN 控制 路 由 器 ， 该 广 域 
网 互联 了 它 的 数据 中 心 [Jain 2013 ] 。 来 自 微 软 研 究 院 的 SWAN [ Hong 2013], ， 使 用 了 一 个 逻 
辑 集中 式 控制 器 来 管理 广域网 和 数据 中 心 网 络 之 间 的 路 由 选择 和 转发 。 中 国电 信和 中 国联 通 
在 它们 的 数据 中 心 内 以 及 数据 中 心 之 间 使 用 SDN [Li2015], AT&T 已 经 通告 [AT&T 2013 ] : 
“支持 许多 SDN 能力， 支持 SDN 体系 结构 框架 下 独立 定义 的 、 专 用 的 机 制 。 


5.2 路 由 选择 算法 


在 本 节 中 ， 我 们 将 学 习 路 由 选择 算法 (routing algorithm) ， 其 目的 是 从 发 送 方 到 接收 
方 的 过 程 中 确定 一 条 通过 路 由 器 网 络 的 好 的 路 径 〈 等 价 于 路 由 ) 。 通 常 ， 一 条 好 路 径 指 具 
有 最 低 开 销 的 路 径 。 然 而 我 们 将 看 到 ， 实 践 中 现实 世界 还 关心 诸如 策略 之 类 的 问题 ( 例 
如 ， 有 一 个 规则 是 “属于 组 织 Y 的 路 由 器 X 不 应 转发 任何 来 源 于 组 织 Z 所 属 网 络 的 分 
组 ”) 。 我 们 注意 到 无 论 网 络 控制 平面 采用 每 路 由 器 控制 方法 ， 还 是 采用 逻辑 集中 式 控 制 方 
法 ， 必 定 总 是 存在 一 条 定义 良好 的 一 连 串 路 由 器 ， 使 得 分 组 从 发 送 主机 到 接收 主机 跨越 网 
络 “旅行 ” 。 因 此 ， 计 算 这 些 路 径 的 路 由 选择 算法 是 十 分 重要 的 ， 是 最 重要 的 10 个 十 分 重 
要 的 网 络 概念 之 一 。 

可 以 用 图 来 形式 化 描述 路 由 选择 问题 。 我 们 知道 图 (graph) G=(N, E) 是 一 个 N 个 
节点 和 条 边 的 集合 ， 其 中 每 条 边 是 取 自 NN 的 一 对 节点 。 在 网 络 层 路 由 选择 的 环境 中 ， 图 
中 的 节点 表示 路 由 器 ， 这 是 做 出 分 组 转发 决定 的 点 ; 连接 这 些 节 点 的 边 表 示 这 些 路 由 器 之 
间 的 物理 链 路 。 这 样 一 个 计算 机 网 络 的 图 抽象 显 
示 在 图 5-3 中 。 若 要 查看 某 些 表示 实际 网 络 的 图 ， 
参见 [Dodge 2016; Cheswick 2000]; 对 于 基于 不 
同 的 图 模型 建 模 因特网 的 好 坏 的 讨论 ， 参 见 [Ze- 
gura 1997; Faloutsos 1999; Li 2004 | 。 

如 图 5-3 所 示 ， 一 条 边 还 有 一 个 值 表 示 它 的 开 
销 。 通 常 ， 一 条 边 的 开销 可 反映 出 对 应 链 路 的 物 
理 长 度 〈 例 如 一 条 越 洋 链 路 的 开销 可 能 比 一 条 短 
途 陆 地 链 路 的 开销 高 ) ， 它 的 链 路 速度 ， 或 与 该 链 
路 相关 的 金钱 上 的 开销 。 为 了 我 们 的 目的 ， 我 们 
只 将 这 些 链 路 开销 看 成 是 给 定 的 ， 而 不 必 操 心 这 些 值 是 如 何 确 定 的 。 对 于 五 中 的 任 一 条 边 
(x, y), RMH clx, y) 表示 节点 x My 间 边 的 开销 。 如 果 节 点 对 (x, y) ARTE, W 
置 c(x, y) = o 。 此 外 ， 我 们 在 这 里 考虑 的 都 是 无 向 图 ( 即 图 的 边 没 有 方 品 ) ， 因 此 边 
(x, y) Si (y, x) 是 相同 的 并 且 c(x*，y) =c(y，x) 。 然 而 ， 我 们 将 学 习 的 算法 能 够 很 
容易 地 扩展 到 在 每 个 方向 有 不 同 开销 的 有 疝 链 路 场合 。 同 时 ， 如 果 (x，y) BFE, WA 
y 也 被 称 为 节点 x 的 邻 届 (neighbor) 。 

在 图 抽象 中 为 各 条 边 指派 了 开销 后 ， 路 由 选择 算法 的 天 然 目 标 是 找 出 从 源 到 目的 地 间 
的 最 低 开 销路 径 。 为 了 使 问题 更 为 精确 ， 回 想 在 图 C=(N, E) 中 的 一 条 路 径 (path) 是 
一 个 季 太 序列 (Wy a By) SOFTEN TT (Wy 入 Chee Sales, Cas %) FE 
E 中 的 边 。 路 径 (x, m,-, *) 的 开销 只 是 沿 着 路 径 所 有 边 的 开销 的 总 和 ， 即 
c(x1，X2) +c(%x2，%3) +… +c(x,_1，%,)。 给 定 任 何 两 个 节点 x 和 y， 通 常 在 这 两 个 节点 之 
间 有 许多 条 路 径 ， 每 条 路 径 都 有 一 个 开销 。 这 些 路 径 中 的 一 条 或 多 条 是 最 低 开 销路 径 





图 5-3 ”一 个 计算 机 网 络 的 抽象 图 模型 
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(least-cost path) 。 因 此 最 低 开 销路 径 问 题 是 清楚 的 : 找 出 源 和 目的 地 之 间 具 有 最 低 开 销 的 
一 条 路 。 例 如 ， 在 图 5-3 F, WHA u 和 目的 节点 w 之 间 的 最 低 开 销路 径 是 (u, x, y, 
0) ， 具 有 的 路 径 开 销 是 3。 注 意 到 知 在 图 中 的 所 有 边 具 有 相同 的 开销 ， 则 最 低 开 销路 径 也 
就 是 最 短路 径 (shortest path) ， 即 在 源 和 目的 地 之 间 的 具有 最 少 链 路 数量 的 路 径 。 

作为 一 个 简单 练习 ， 试 找 出 图 5-3 中 从 节点 到 节点 z 的 最 低 开 销路 径 ， 并 要 反映 出 
你 是 如 何 算出 该 路 径 的 。 如 果 你 像 大 多 数 人 一 样 ， 通 过 考察 图 5-3， 跟 踪 几 条 从 w Bz 
路 由 ， 你 就 能 找 出 从 到 zz 的 路 径 ， 然 后 以 某 种 方式 来 确信 你 所 选择 的 路 径 就 是 所 有 可 能 
的 路 径 中 具有 最 低 开 销 的 路 径 。( 你 考察 过 w Bz ZITA 17 条 可 能 的 路 径 吗 ?很 可 能 
没有 !) 这 种 计算 就 是 一 种 集中 式 路 由 选择 算法 的 例子 ， 即 路 由 选择 算法 在 一 个 位 置 (你 
的 大 脑 中 ) 运行 ， 该 位 置 具有 网 络 的 完整 信息 。 一 般 而 言 ， 路 由 选择 算法 的 一 种 分 类 方式 
是 根据 该 算法 是 集中 式 还 是 分 散 式 来 划分 。 

e 集中 式 路 由 选择 算法 (centralized routing algorithm) 用 完整 的 、 全 局 性 的 网 络 知识 

计算 出 从 源 到 目的 地 之 间 的 最 低 开 销路 径 。 也 就 是 说 ， 该 算法 以 所 有 节点 之 间 的 
连通 性 及 所 有 链 路 的 开销 为 输入 。 这 就 要 求 该 算法 在 真正 开始 计算 以 前 ， 要 以 某 
种 方式 获得 这 些 信 息 。 计 算 本 身 可 在 某 个 场 点 〈 例 如 ， 图 5-2 中 所 示 的 逻辑 集中 
式 控 制 器 ) 进行 ， 或 在 每 台 路 由 器 的 路 由 选择 组 件 中 重复 进行 〈 例 如 在 图 5-1 
中 ) 。 然 而 ， 这 里 的 主要 区 别 在 于 ， 集 中 式 算 法 具有 关于 连通 性 和 链 路 开销 方面 的 
完整 信息 。 具 有 全 局 状态 信息 的 算法 常 被 称 作 链 路 状态 (Link State, LS) 算法 ， 
因为 该 算法 必须 知道 网 络 中 每 条 链 路 的 开销 。 我 们 将 在 5.2. 1 节 中 学 习 LS 算法 。 

e 在 分 散 式 路 由 选择 算法 (decentralized routing algorithm) F, PRA AIRC, ah 

式 的 方式 计算 出 最 低 开 销路 径 。 没 有 节点 拥有 关于 所 有 网 络 链 路 开销 的 完整 信息 。 
相反 ， 每 个 节点 仅 有 与 其 直接 相连 链 路 的 开销 知识 即 可 开始 工作 。 然 后 ， 通 过 移 
代 计 算 过 程 以 及 与 相 邻 节点 的 信息 交换 ， 一 个 节点 逐渐 计算 出 到 达 某 目的 节点 或 
一 组 目的 节点 的 最 低 开 销路 径 。 我 们 将 在 后 面 的 5.2.2 市 学 习 一 个 称 为 距离 向 量 
( Distance- Vector, DV) 算法 的 分 散 式 路 由 选择 算法 。 之 所 以 叫 作 DV 算法 ， 是 因 
为 每 个 节点 维护 到 网 络 中 所 有 其 他 节点 的 开销 (距离) 估计 的 向 量 。 这 种 分 散 式 
算法 ， 通 过 相 邻 路 由 器 之 间 的 交互 式 报 文 交 换 ， 也 许 更 为 天 然 地 适合 那些 路 由 器 
直接 交互 的 控制 平面 ， 就 像 在 图 5-1 中 那样 。 

路 由 选择 算法 的 第 二 种 广义 分 类 方式 是 根据 算法 是 静态 的 还 是 动态 的 进行 分 类 。 在 静 
态 路 由 选择 算法 (static routing algorithm) 中 ， 路 由 随时 间 的 变化 非常 缓慢 ， 通 常 是 人 工 进 
行 调 整 (如 人 为 手工 编辑 一 条 链 路 开销 ) 。 动 态 路 由 选择 算法 (dynamic routing algorithm) 
随 着 网 络 流量 负载 或 拓扑 发 生变 化 而 改变 路 由 选择 路 径 。 一 个 动态 算法 可 周期 性 地 运行 或 
直接 响应 拓扑 或 链 路 开销 的 变化 而 运行 。 虽 然 动 态 算法 易于 对 网 络 的 变化 做 出 反应 ， 但 也 
更 容易 受 诸 如 路 由 选择 循环 、 路 由 振荡 之 类 问题 的 影响 。 

路 由 选择 算法 的 第 三 种 分 类 方式 是 根据 它 是 负载 敏感 的 还 是 负载 迟钝 的 进行 划分 。 在 
负载 敏感 算法 (load-sensitive algorithm) 中 ， 链 路 开销 会 动态 地 变化 以 反映 出 底层 链 路 的 
当前 拥塞 水 平 。 如 果 当 前 拥塞 的 一 条 链 路 与 高 开销 相 联系 ， 则 路 由 选择 算法 趋向 于 组 开 该 
拥塞 链 路 来 选择 路 由 。 而 早期 的 ARPAnet 路 由 选择 算法 就 是 负载 敏感 的 [ McQuillan 
1980], ， 所 以 遇 到 了 许多 难题 [ Huitema 1998 ] 。 当 今 的 因特网 路 由 选择 算法 (如 RIP, 
OSPF 和 BGP) 都 是 负载 迟钝 的 (load-insensitive) ， 因 为 某 条 链 路 的 开销 不 明确 地 反映 其 当 
前 (或 最 近 ) 的 拥塞 水 平 。 
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5.2.1 链 路 状态 路 由 选择 算法 


前 面 讲 过 ， 在 链 路 状态 算法 中 ， 网 络 拓扑 和 所 有 的 链 路 开销 都 是 已 知 的 ， 也 就 是 说 可 
FATE LS 算法 的 输入 。 实 践 中 这 是 通过 让 每 个 节点 向 网 络 中 所 有 其 他 节点 广播 链 路 状态 分 
组 来 完成 的 ， 其 中 每 个 链 路 状态 分 组 包含 它 所 连接 的 链 路 的 标识 和 开销 。 在 实践 中 〈 例 如 
使 用 因特网 的 OSPF 路 由 选择 协议 ， 讨 论 见 5.3 节 ) ， 这 经 常 由 链 路 状态 广播 〈link state 
broadcast) 算法 [Perlman 1999] 来 完成 。 节 点 广播 的 结果 是 所 有 节点 都 具有 该 网 络 的 统 
一 、 完 整 的 视图 。 于 是 每 个 节点 都 能 够 像 其 他 节点 一 样 ， 运 行 LS 算法 并 计算 出 相同 的 最 
低 开 销路 径 集合 。 

我 们 下 面 给 出 的 链 路 状态 路 由 选择 算法 叫 作 Dijkstra 算法 ， 该 算法 以 其 发 明 者 命名 。 一 
个 密切 相关 的 算法 是 Prim 算法 ， 有 关 图 算法 的 一 般 性 讨论 参见 [Comen 2001 ] Dijkstra 算 
法 计算 从 某 节点 ( 源 节 点 ,我 们 称 之 为 u) 到 网 络 中 所 有 其 他 节点 的 最 低 开 销路 径 。Dijkstra 
算法 是 迭代 算法 ， 其 性 质 是 经 算法 的 第 上 次 迭代 后 ， 可 知道 到 大 个 目的 节点 的 最 低 开 销路 径 ， 
在 到 所 有 目的 节点 的 最 低 开销 路 径 之 中 ， 这 上 条 路 径 具 有 % 个 最 低 开销 。 我 们 定义 下 列 记号 。 

© Div): 到 算法 的 本 次 迭代 ， 从 源 节 点 到 目的 节点 " 的 最 低 开 销路 径 的 开销 。 

© p(v): 从 源 到 wv 沿 着 当前 最 低 开销 路 径 的 前 一 节点 (v 的 邻居 ) 。 

e N: WATR; 如 果 从 源 到 vw 的 最 低 开 销路 径 已 确 知 ,> ÆN 中 。 

该 集中 式 路 由 选择 算法 由 一 个 初始 化 步骤 和 其 后 的 循环 组 成 。 循 环 执行 的 次 数 与 网 络 中 
节点 个 数 相同 。 一 旦 终止 ， 该 算法 就 计算 出 了 从 源 节 点 履 到 网 络 中 每 个 其 他 节点 的 最 短路 径 。 

源 节点 U 的 链 路 状态 (LS) 算法 


Initialization: 
N’ = {u} 
for all nodes v 
if v is a neighbor of u 
then D(v) = c(u,v) 
else D(v) =o 


DAD UM &WN PF 


Loop 

9 find w not in N’ such that D(w) is a minimum 

10 add w to N’ 

11 update D(v) for each neighbor v of w and not in N’: 
iz D(v) = min(D(v), D(w)+ c(w,v) ) 

13 /* new cost to v is either old cost to v or known 
14 least path cost to w plus cost from w to v */ 

15 until N’= N 


举 一 个 例子 ， 考 虑 图 5-3 中 的 网 络 ， 计 算 从 到 所 有 可 能 目的 地 的 最 低 开 销路 径 。 该 
算法 的 计算 过 程 以 表格 方式 总 结 于 表 5-1 中 ， 表 中 的 每 一 行 给 出 了 迭代 结束 时 该 算法 的 变 
量 的 值 。 我 们 详细 地 考虑 前 几 个 步骤 。 


表 5-1 在 图 5-3 中 的 网 络 上 运行 的 链 路 状态 算法 
步骤 N' Div), piv) Dw), p(w) D(x), p(x) D(y), Ply) D(z), p(z) 


0 u 2, u 5, u l, u oo oo 
] ux 25 u 4, x 2 % op 
2 uxy oe 35 ¥ 4,y¥ 
3 uxyv EE 4, y 
4 uxyvw ts 
5 uxyvwz 
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e 在 初始 化 步骤 ， 从 u 到 与 其 直接 相连 的 邻居 v、x、w 的 当前 已 知 最 低 开 销路 径 分 别 
初始 化 为 2、1 和 5。 特 别 值得 注意 的 是 ， 到 w 的 开销 被 设 为 5 (尽管 我 们 很 快 就 会 
看 见 确实 存在 一 条 开销 更 小 的 路 径 ) ， 因 为 这 是 从 w 到 w 的 直接 (一 跳 ) 链 路 开 
销 。 到 y 与 z 的 开销 被 设 为 无 穷 大 ， 因 为 它们 不 直接 与 & 连接 。 

© 在 第 一 次 迭代 中 ,我 们 观察 那些 还 未 加 到 集合 W' 中 的 节点 ， 并 且 找 出 在 前 一 次 和 迭 

代 结 束 时 具有 最 低 开 销 的 节点 。 那 个 节点 便 是 x， 其 开销 是 1， 因 此 x 被 加 到 集合 

N' 中 。 于 是 LS 算法 中 的 第 12 行 中 的 程序 被 执行 ， 以 更 新 所 有 节点 的 D(z) ， 产 

生 表 5-1 中 第 2 行 (步骤 1) 所 示 的 结果 。 到 vw 的 路 径 开销 未 变 。 经 过 节点 x 到 w 

(在 初始 化 结束 时 其 开销 为 5) 的 路 径 开销 被 发 现 为 4。 因 此 这 条 具有 更 低 开销 的 路 

径 被 选中 ， 且 沿 从 之 开始 的 最 短路 径 上 wR RRA x, BW, By (经 

过 x) 的 开销 被 计算 为 2， 且 该 表 也 被 相应 地 更 新 。 

在 第 二 次 迭代 时 ， 节 点 v 与 y 被 发 现 具有 最 低 开 销路 径 (2) ， 并 且 我 们 任意 改变 次 

FH y 加 到 集合 N' 中 ,使 得 和 N' 中 含有 ww、x 和 ys。 到 仍 不 在 NV' 中 的 其 余 节 点 ( 即 节 

点 v、w 和 z) 的 开销 通过 LS 算法 中 的 第 12 行进 行 更 新 ， 产 生 如 表 5-1 中 第 3 行 所 

示 的 结果 。 

© 如 此 等 等 。 

当 LS 算法 终止 时 ， 对 于 每 个 节点 ， 我 们 都 得 到 从 源 节 点 沿 着 它 的 最 低 开 销路 径 的 
前 一 节点 。 对 于 每 个 前 一 节点 ， 我 们 又 有 它 的 前 一 节点 ， 以 此 方式 我 们 可 以 构建 从 源 节 
点 到 所 有 目的 节点 的 完整 路 径 。 通 过 对 每 个 目的 节点 存放 从 ww 到 目的 地 的 最 低 开 销路 径 
上 的 下 一 跳 节 点 ， 在 一 个 节点 (如 节 
miu) 中 的 转发 表 则 能 够 根据 此 信息 
而 构建 。 图 5-4 显示 了 对 于 图 5-3 中 
的 网 络 产 生 的 最 低 开 销路 径 和 w 中 的 

该 算法 的 计算 复杂 性 是 什么 ” 即 给 
定 n 个 节点 (不 算 源 节点 )， 在 最 坏 情 
况 下 要 经 过 多 少 次 计算 ,才能 找到 从 源 节点 到 所 有 目的 节点 的 最 低 开 销路 径 ? 在 第 一 次 迭 
代 中 ,我 们 需要 搜索 所 有 的 ni 个 节点 以 确定 出 不 在 N' 中 且 具 有 最 低 开 销 的 节点 w。 在 第 二 
次 迭代 时 ， 我们 需要 检查 n -1 个 节点 以 确定 最 低 开 销 。 第 三 次 对 于 -2 个 节点 和 迭代， 依次 
类 推 。 总 之 ， 我 们 在 所 有 迭代 中 需要 搜寻 的 节点 总 数 为 上 (+1)X， 因 此 我 们 说 前 面 实现 
的 链 路 状态 算法 在 最 差 情况 下 复杂 性 为 0(n*)。( 该 算法 的 一 种 更 复杂 的 实现 是 使 用 一 种 
称 为 堆 的 数据 结构 ， 能 用 对 数 时 间 而 不 是 线性 时 间 得 到 第 9 行 的 最 小 值 ， 因 而 减少 其 复 
杂 性 。) 

在 完成 LS 算法 的 讨论 之 前 ， 我 们 考虑 一 下 可 能 出 现 的 问题 。 图 5-5 显示 了 一 个 简单 
的 网 络 拓扑 ， 图 中 的 链 路 开销 等 于 链 路 上 承载 的 负载 ， 例 如 反映 要 历经 的 时 延 。 在 该 例 
中 ， 链 路 开销 是 非 对 称 的 ， 即 仅 当 在 链 路 (u, v) 两 个 方向 所 承载 的 负载 相同 时 c(u,，v) 
Helv, u) 才 相 等 。 在 该 例 中 ， 节 点 z 产 生发 往 w 的 一 个 单元 的 流量 ， 节 点 x 也 产生 发 往 
w 的 一 个 单元 的 流量 ， 并 且 节 点 y 也 产生 发 往 w 的 一 个 数量 为 e 的 流量 。 初 始 路 由 选择 情 
况 如 图 5-5a 所 示 ， 其 链 路 开销 对 应 于 承载 的 流量 。 

当 LS 算法 再 次 运行 时 ， 节 点 y 确定 (基于 图 5-5a 所 示 的 链 路 开销 ) 顺 时 针 到 w 的 路 
径 开销 为 1， 而 逆 时 针 到 w 的 路 径 开销 (一 直 使 用 的 ) 是 1+e。 因 此 y 到 w 的 最 低 开 销路 





图 5-4 ”对 于 节点 的 最 低 开 销路 径 和 转发 表 
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径 现 在 是 顺 时 针 的 。 类 似 地 ，* 确定 其 到 w 的 新 的 最 低 开 销路 径 也 是 顺 时 针 的 ， 产 生 如 
图 5-5b 中 所 示 的 开销 。 当 LS 算法 下 次 运行 时 ， 节 点 x*、y 和 z 都 检测 到 一 条 至 w 的 逆 时 针 
方向 零 开销 路 径 ， 它 们 都 将 其 流量 引导 到 逆 时 针 方 向 的 路 由 上 。 下 次 LS 算法 运行 时 ，x、 
y 和 z 都 将 其 流量 引导 到 顺 时 针 方向 的 路 由 上 。 


~ nes Sam 





c) x、y、z 检 测 到 w 的 更 好 路 径 ， 逆 时 针 d) x、y、z 检 测 到 w 的 更 好 路 径 ， 顺 时 针 
图 5-5 拥塞 敏感 的 路 由 选择 的 振荡 


如 何 才 能 防止 这 样 的 振荡 ( 它 不 只 是 出 现在 链 路 状态 算法 中 ， 而 且 也 可 能 出 现在 任 
何 使 用 拥塞 或 基于 时 延 的 链 路 测度 的 算法 中 )。 一 种 解决 方案 可 能 强制 链 路 开销 不 依赖 
于 所 承载 的 流量 ,但 那 是 一 种 不 可 接受 的 解决 方案 ， 因 为 路 由 选择 的 目标 之 一 就 是 要 如 
开 高 度 拥塞 ( 如 高 时 延 ) 的 链 路 。 另 一 种 解决 方案 就 是 确保 并 非 所 有 的 路 由 器 都 同时 
运行 LS 算法。 这 似乎 是 一 个 更 合理 的 方案 ， 因 为 我 们 希望 即使 路 由 器 以 相同 周期 运行 
LS 算法 ， 在 每 个 节点 上 算法 执行 的 时 机 也 将 是 不 同 的 。 有 趣 的 是 ， 人 研究 人 员 近 来 已 注 
意 到 了 因特网 上 的 路 由 器 能 在 它们 之 间 进 行 目 同步 [Floyd Synchronization 1994 | 。 这 就 
是 说 ， 即 使 它们 初始 时 以 同一 周期 但 在 不 同时 刻 执行 算法 ， 算 法 执行 时 机 最 终 会 在 路 由 
器 上 变 为 同步 并 保持 之 。 避 免 这 种 自 同 步 的 一 种 方法 是 ， 让 每 台 路 由 器 发 送 链 路 通告 的 
时 间 随 机 化 。 

学 习 过 LS 算法 之 后 ， 我 们 接 下 来 考虑 目前 在 实践 中 使 用 的 其 他 重要 的 路 由 选择 算法 ， 
即 距 离 向 量 路 由 选择 算法 。 


5.2.2 距离 向 量 路 由 选择 算法 


距离 向 量 (Distance- Vector，DV) 算法 是 一 种 和 迭代 的 、 异 步 的 和 分 布 式 的 算法 ， 而 LS 
算法 是 一 种 使 用 全 局 信息 的 算法 。 说 它 是 分 布 式 的 ， 是 因为 每 个 节点 都 要 从 一 个 或 多 个 直 
接 相连 邻居 接收 某 些 信息 ， 执 行 计 算 ， 然 后 将 其 计算 结果 分 发 给 邻 届 。 说 它 是 和 迭代 的 ， 是 


MAB: fet FR 249 


因为 此 过 程 一 直 要 持续 到 邻居 之 间 无 更 多 信息 要 交换 为 止 。( 有 趣 的 是 ， 此 算法 是 目 我 终 
止 的 ， 即 没有 计算 应 该 停止 的 信号 ， 它 就 停止 了 。) 说 它 是 异步 的 ， 是 因为 它 不 要 求 所 有 
节点 相互 之 间 步 伐 一 致 地 操作 。 我 们 将 看 到 一 个 异步 的 、 迭 代 的 、 自 我 终止 的 、 分 布 式 的 
算法 比 一 个 集中 式 的 算法 要 有 趣 得 多 ! 

在 我 们 给 出 DV 算法 之 前 ， 有 必要 讨论 一 下 存在 于 最 低 开 销路 径 的 开销 之 间 的 一 种 重 
要 关系 。 令 d,(y) 是 从 节点 x 到 节点 y 的 最 低 开 销路 径 的 开销 。 则 该 最 低 开 销 与 著名 的 
Bellman- Ford 方程 相关 ， 即 

d,(y) = min,{c(x,v) +d,(y) | (5-1) 

方程 中 的 min, 是 对 于 x 的 所 有 邻居 的 。Bellman- Ford 方程 是 相当 直观 的 。 实 际 上 ， 从 > 

到 vw 遍历 之 后 ， 如 果 我 们 接 下 来 取 从 v 到 y 的 最 低 开 销路 径 ， 则 该 路 径 开 销 将 是 c(x, v) + 

d,(y) 。 因 此 我 们 必须 通过 遍历 某 些 邻 居 v 开始 ， 从 x 到 y 的 最 低 开 销 是 对 所 有 邻居 v 的 
c(x, v) +d,(y) 的 最 小 值 。 

但 是 对 于 那些 可 能 怀疑 该 方程 正确 性 的 人 ， 我 们 核查 在 图 5-3 中 的 源 节 点 u 和 目的 节 
点 z。 源 节点 uw 有 3 个 邻居 : 节点 v、x 和 zw。 通过 遍历 该 图 中 的 各 条 路 径 ， 容 易 看 出 d,(z) = 
5. d,(z) =3 Ald,(z) =3, 将 这 些 值 连 同 开销 如 区 大 =2602 x) =1 Mc(u, w) =S5 Fk 
人 方程 (5-1) 得 出 d,(z) =min{2 +5, 5+3, 1 +3| =4， 这 显然 是 正确 的 ， 并 且 对 同一 
个 网 络 来 说 ， 这 正 是 Dijkstra 算法 为 我 们 提供 的 结果 。 这 种 快速 验证 应 当 有 助 于 消除 你 可 
能 具有 的 任何 怀疑 。 

Bellman- Ford 方程 不 止 是 一 种 智力 上 的 珍品 ， 它 实际 上 具有 重大 的 实践 重要 性 。 特 别 
是 对 Bellman-Ford 方程 的 解 为 节点 x 的 转发 表 提 供 了 表 项 。 为 了 理解 这 一 点 ， 令 是 取得 
方程 (5-1) 中 最 小 值 的 任何 相 邻 节点 。 接 下 来 ， 如 果 节 点 x 要 沿 着 最 低 开 销路 径 向 节点 7 
发 送 一 个 分 组 ， 它 应 当 首先 癌 节 点 转发 该 分 组 。 因 此 ， 节 点 * 的 转发 表 将 指定 节点 六 
作为 最 终 目的 地 y 的 下 一 跳 路 由 器 。Bellman-Ford 方程 的 另 一 个 重要 实际 贡献 是 ， 它 提出 
了 将 在 DV 算法 中 发 生 的 邻居 到 邻居 通信 的 形式 。 

其 基本 思想 如 下 。 每 个 节点 x 以 D,(y) 开始 ， 对 在 中 的 所 有 节点 y， 估 计 从 x 到 y 
的 最 低 开 销路 径 的 开销 。 令 D.=[D.(y): yeN] 是 节点 x 的 距离 器 量 , 该 向 量 是 从 x 到 
在 NN 中 的 所 有 其 他 节点 y 的 开销 估计 向 量 。 使 用 DV 算法 ， 每 个 节点 x 维护 下 列 路 由 选择 
信息 : 

e 对 于 每 个 邻居 vv， 从 x* 到 直接 相连 邻居 vw 的 开销 为 c(x，v)。 

e 节点 x 的 距离 向 量 , BD, =[D;(y): yeN], 包含 了 x 到 NN 中 所 有 目的 地 y 的 开销 

估计 值 。 

e 它 的 每 个 邻居 的 距离 向 量 ， 即 对 x 的 每 个 邻居 vv， 有 D, =[D,(y): yeN]。 

在 该 分 布 式 、 异 步 算法 中 ， 每 个 节点 不 时 地 向 它 的 每 个 邻居 发 送 它 的 距离 向 量 副本 。 
当 节 点 x 从 它 的 任何 一 个 邻居 vw 接收 到 一 个 新 距离 向 量 ， 它 保存 v 的 距离 向 量 ， 然 后 使 用 
Bellman- Ford 方程 更 新 它 自 己 的 距离 向 量 如 下 : 

D.(y) = min,{c(x,v) +D(y)} 对 NV 中 的 每 个 节点 

如 果 节 点 x 的 距离 问 量 因 这 个 更 新 步骤 而 改变 ， 节 点 x 接 下 来 将 向 它 的 每 个 邻居 发 送 
其 更 新 后 的 距离 向 量 ， 这 继而 让 所 有 邻居 更 新 它们 自己 的 距离 向 量 。 令 人 惊奇 的 是 ， 只 要 
所 有 的 节点 继续 以 异步 方式 交换 它们 的 距离 向 量 ， 每 个 开销 估计 D,(y) 收敛 到 d, (y), 
d.(y) 为 从 节点 xx 到 节点 y 的 实际 最 低 开 销路 径 的 开销 [ Bersekas 1991 ] ! 
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距离 向 量 (DV) 算法 


1 Initialization: 

2 for all destinations y in N: 

3 D.(y)= c(x,y)/* if y is not a neighbor then c(x,y)= œ */ 
4 for each neighbor w 

5 D,(Y) = ? for all destinations y in N 

6 for each neighbor w 

7 send distance vector D, = [D,(y): y in N] tow 

8 

9 loop 

10 wait (until I see a link cost change to some neighbor w or 
Li until I receive a distance vector from some neighbor w) 
12 

13 for each y in N: 

14 D.(y) = min, {c(x,v) + D,(y)} 


T5 

16 if Dx(y) changed for any destination y 

aT send distance vector D, = [D, (yY): y in N] to all neighbors 
18 

19 forever 


在 该 DV 算法 中 ， 当 节点 x 发 现 它 的 直接 相连 的 链 路 开销 变化 或 从 某 个 邻居 接收 到 一 
个 距离 向 量 的 更 新 时 ， 它 就 更 新 其 距离 向 量 估 计 值 。 但 是 为 了 一 个 给 定 的 目的 地 y 而 更 新 
它 的 转发 表 ， 节 点 x 真正 需要 知道 的 不 是 到 y 的 最 短路 径 距 离 ， 而 是 沿 着 最 短路 径 到 y 的 
下 一 跳 路 由 器 邻居 节点 v"(y) 。 如 你 可 能 期 望 的 那样 ， 下 一 跳 路 由 器 w” (y) 是 在 DV 算法 
第 14 行 中 取得 最 小 值 的 邻居 v。 (如 果 有 多 个 取得 最 小 值 的 邻居 v， 则 >” (y) 能 够 是 其 中 
任何 一 个 有 最 小 值 的 邻居 。) 因此 ， 对 于 每 个 目的 地 y， 在 第 13 ~14 行 中 ,节点 x 也 决定 
v"(y) 并 更 新 它 对 目的 地 y 的 转发 表 。 

前 面 讲 过 LS 算法 是 一 种 全 局 算法 ， 在 于 它 要 求 每 个 节点 在 运行 Dijkstra 算法 之 前 ， 首 
先 获得 该 网 络 的 完整 信息 。DYV 算法 是 分 布 式 的 ， 它 不 使 用 这 样 的 全 局 信息 。 实 际 上 ， 节 
点 具有 的 唯一 信息 是 它 到 直接 相连 邻居 的 链 路 开销 和 它 从 这 些 邻 居 接 收 到 的 信息 。 每 个 节 
点 等 待 来 自任 何 邻 居 的 更 新 (第 10 ~ 11 行 )， 当 接收 到 一 个 更 新 时 计算 它 的 新 距离 向 量 
(第 14 行 ) 并 向 它 的 邻居 分 布 其 新 距离 向 量 (第 16~17 行 )。 在 实践 中 许多 类 似 DV HR 
法 被 用 于 多 种 路 由 选择 协议 中 ,包括 因特网 的 RIP 和 BGP, ISO IDRP, Novell IPX 和 早期 
的 ARPAnet, 

图 5-6 举例 说 明了 DV 算法 的 运行 ， 应 用 场合 是 该 图 项 部 有 三 个 节点 的 简单 网 络 。 算 
法 的 运行 以 同步 的 方式 显示 出 来 ， 其 中 所 有 节点 同时 从 其 邻居 接收 报 文 ， 计 算 其 新 距离 向 
量 ， 如 果 距 离 向 量 发 生 了 变化 则 通知 其 邻居 。 学 习 完 这 个 例子 后 ， 你 应 当 确 信 该 算法 以 异 
步 方式 也 能 正确 运行 ， 异 步 方式 中 可 在 任意 时 刻 出 现 节点 计算 与 更 新 的 产生 /接收 。 

该 图 最 左边 一 列 显示 了 这 3 个 节点 各 自 的 初始 路 由 选择 表 (routing table) 。 例 如 ， 位 
于 左上 角 的 表 是 节点 « 的 初始 路 由 选择 表 。 在 一 张 特定 的 路 由 选择 表 中 ， 每 行 是 一 个 距离 
向 量 一 一 特别 是 每 个 节点 的 路 由 选择 表 包 括 了 它 的 距离 向 量 和 它 的 每 个 邻居 的 距离 问 量 。 
因此 ， 在 节点 x 的 初始 路 由 选择 表 中 的 第 一 行 是 D, =[D.(*)，D.(y)，D.(z)] =[0, 2, 
7]。 在 该 表 的 第 二 和 第 三 行 是 最 近 分 别 从 节点 y 和 z 收 到 的 距离 向 量 。 因 为 在 初始 化 时 节 
点 x 还 没有 从 节点 y 和 zz 收 到 任何 东西 ， 所 以 第 二 行 和 第 三 行 表 项 中 被 初始 化 为 无 穷 大 。 

初始 化 后 ， 每 个 节点 同 它 的 两 个 邻居 发 送 其 距离 向 量 。 图 5-6 中 用 从 表 的 第 一 列 到 表 
的 第 二 列 的 箭头 说 明了 这 一 情况 。 例 如 ， 节 点 x 回 两 个 节点 y 和 z 发送 了 它 的 距离 向 量 
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D. = [0，2，7] 。 在 接收 到 该 更 新 后 ， 每 个 节点 重新 计算 它 自己 的 距离 向 量 。 例 如 ， 节 点 
x 计算 

D.(x) =0 

D,(y) =minjc(x,y) + D,(y) ,c(x,z) +D,(y)} = minj2 +0,7 +1} =2 

D,(z) =minjc(x,y) + D(z) ,c(x,z) + D;(z)} = min{2 +1,7 +0} =3 

第 二 列 因此 为 每 个 节点 显示 了 节点 的 新 距离 向 量 连同 刚 从 它 的 邻居 接收 到 的 距离 向 

量 。 注 意 到 ， 例 如 节点 x 到 节点 z 的 最 低 开销 估计 了 .(z) 已 经 从 7 变 成 了 3。 还 应 注意 到 ， 
对 于 节点 x， 节 点 yY 在 该 DV 算法 的 第 14 行 中 取得 了 最 小 值 ; 因此 在 该 算法 的 这 个 阶段 ， 
我 们 在 节点 x 得 到 了 v (y) =y Alo" (z) =y。 





图 5-6 DV 算法 


在 节点 重新 计算 它们 的 距离 向 量 之 后 ， 它 们 再 次 向 其 邻居 发 送 它们 的 更 新 距离 向 量 
(如 果 它 们 已 经 改变 的 话 ) 。 图 5-6 中 由 从 表 第 二 列 到 表 第 三 列 的 箭头 说 明了 这 一 情况 。 注 
意 到 仅 有 节点 x 和 节点 z 发 送 了 更 新 : 节点 y 的 距离 向 量 没有 发 生变 化 ， 因 此 节点 y 没有 
发 送 更 新 。 在 接收 到 这 些 更 新 后 ， 这 些 节点 则 重新 计算 它们 的 距离 向 量 并 更 新 它们 的 路 由 
选择 表 ， 这 些 显示 在 第 三 列 中 。 
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从 邻居 接收 更 新 距离 向 量 、 重 新 计算 路 由 选择 表 项 和 通知 邻居 到 目的 地 的 最 低 开销 路 
径 的 开销 已 经 变化 的 过 程 继 续 下 去 ， 直 到 无 更 新 报 文 发 送 为 止 。 在 这 个 时 候 ， 因 为 无 更 新 
报 文 发 送 ， 将 不 会 出 现 进 一 步 的 路 由 选择 表 计 算 ， 该 算法 将 进入 静止 状态 ， 即 所 有 的 节点 
将 执行 DV 算法 的 第 10 ~ 11 行 中 的 等 待 。 该 算法 停留 在 静止 状态 ， 直 到 一 条 链 路 开销 发 生 
改变 ， 如 下 面 所 讨论 的 那样 。 
1. 距离 向量 算法 : 链 路 开销 改变 与 链 路 故障 
当 一 个 运行 DV 算法 的 节点 检测 到 从 它 自己 到 邻居 的 链 路 开销 发 生变 化 时 (第 10 ~11 
行 ), 它 就 更 新 其 距离 向 量 (第 13 ~14 
行 )， 并 且 如 果 最 低 开 销路 径 的 开销 发 和 AAA 60. ii 
变化 ， 向 邻居 通知 其 新 的 距离 向 量 (第 有 ER 区 Sx 
16 ~17 行 )。 图 5-7a 图 示 了 从 y 到 x 的 链 . 
路 开销 从 4 变 为 1 的 情况 。 我 们 在 此 只 关 a) b) 
注 y 与 z 到 目的 地 x 的 距离 表 中 的 有 关 表 图 5-7 链 路 开销 改变 
项 。 该 DV 算法 导致 下 列 事件 序列 的 出 现 : 
e FEto TZ, y 检测 到 链 路 开销 变化 (开销 从 4 变 为 1) ， 更 新 其 距离 向 量 ， 并 通知 其 
邻居 这 个 变化 ， 因 为 最 低 开 销路 径 的 开销 已 改变 。 
o 764, 时 刻 ，z 收 到 来 自 y 的 更 新 报 文 并 更 新 了 其 距离 表 。 它 计算 出 到 x 的 新 最 低 开 
销 (从 开销 5 减 为 开销 2) ， 它 向 其 邻居 发 送 了 它 的 新 距离 向 量 。 
o 在 t, 时刻，y 收 到 来 自 z 的 更 新 并 更 新 其 距离 表 。y 的 最 低 开 销 未 变 ， 因 此 y 不 发 
送 任何 报 文 给 z。 该 算法 进入 静止 状态 。 
因此 ， 对 于 该 DV 算法 只 需 两 次 迭代 就 到 达 了 静止 状态 。 在 x 与 y 之 间 开 销 减少 的 好 
消息 通过 网 络 得 到 了 迅速 传播 。 
我 们 现在 考虑 一 下 当 某 链 路 开销 增加 时 发 生 的 情况 。 假 设 x 与 y 之 间 的 链 路 开销 从 4 
增加 到 60， 如 图 5-7b 所 示 。 
1) 在 链 路 开销 变化 之 前 ，D,(x) =4, D,(z) =1，D.(y) =1 和 D.(x) =5。 TE to 时刻， 
y 检测 到 链 路 开销 变化 (开销 从 4 变 为 60) 。y 计算 它 到 x 的 新 的 最 低 开 销路 径 的 开销 ， 其 
值 为 






D, (x) = minjc(y,x) + D,(x),c(y,z) +D,(x)} = min{j60 +0,1 +5} =6 

当然 ， 从 网 络 全 局 的 视角 来 看 ， 我 们 能 够 看 出 经 过 z 的 这 个 新 开销 是 错误 的 。 但 节点 
y 仅 有 的 信息 是 : 它 到 x 的 直接 开销 是 60， 且 z 上 次 已 告诉 y，z 能 以 开销 5 到 x。 因 此 ， 
为 了 到 达 x, y 将 通过 z 路 由 ， 完 全 期 望 z 能 以 开销 5 到 达 x*。 到 了 时 刻 ， 我 们 遇 到 路 由 
选择 环 路 (routing loop), AANA x, yiiz 路 由 ，z 又 通过 y 路 由 。 路 由 选择 环 路 就 像 
一 个 黑洞 ， 即 目的 地 为 x 的 分 组 在 所 时 刻 到 达 y 或 z 后 ,将 在 这 两 个 节点 之 间 不 停 地 (或 
直到 转发 表 发 生 改 变 为 止 ) 来 回 反 复 。 

2) 因为 节点 y 已 算出 到 x% 的 新 的 最 低 开 销 ， 它 在 i 时 刻 将 该 新 距离 向 量 通知 zo 

3) Æt 后 某 个 时 间 ，z 收 到 y 的 新 距离 向 量 ， 它 指示 了 y 到 x 的 最 低 开销 是 6。z 知道 
它 能 以 开销 1 到 达 y， 因 此 计算 出 到 x 的 新 最 低 开 销 D.(x) =min{50+0, 1+6} =7。 因 为 
z 到 x 的 最 低 开 销 已 增加 了 ， 于 是 它 便 在 i 时 刻 通 知 y 其 新 开销 。 

4) 以 类 似 方式 ， 在 收 到 z 的 新 距离 向 量 后 ，y 决定 D,(x) =8 并 向 z 发 送 其 距离 向 量 。 
接 下 来 z 确定 D,(x) =9 并 向 y 发 送 其 距离 向 量 ， 等 等 。 
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该 过 程 将 要 继续 多 久 呢 ?你 应 认识 到 该 循环 将 持续 44 次 迭代 (在 y 与 z 之 间 交 换 报 
文 ) ， 即 直到 z 最 终 算出 它 经 由 y 的 路 径 开 销 大 于 50 为 止 。 此 时 , z 将 (最终) MEER x 
的 最 低 开销 路 径 是 经 过 它 到 x 的 直接 连接 。y 将 经 由 z 路 由 选择 到 *。 关 于 链 路 开销 增加 的 
坏 消 息 的 确 传播 得 很 慢 ! 如 果 链 路 开销 c(y,x) 从 4 变 为 10 000 HF e(z, x) 为 9999 
时 将 发 生 什么 样 的 现象 呢 ? 由 于 这 种 情况 ， 我 们 所 见 的 问题 有 时 被 称 为 无 穷 计数 ( count- 
to-infinity) 问题 。 

2. 距离 向 量 算 法 : 增加 毒性 逆转 

刚才 描述 的 特定 循环 的 场景 可 以 通过 使 用 一 种 称 为 毒性 逆转 ( poisoned reverse) 的 技 
术 而 加 以 避免 。 其 思想 较为 简单 : 如 果 z 通过 yy 路 由 选择 到 目的 地 x， 则 z 将 通告 y， 它 
( 即 z) 到 x 的 距离 是 无 穷 大 ， 也 就 是 z 将 向 y 通告 D,(x) =wm (即使 z 实际 上 知道 D,(x) = 
5)。 只 要 z 经 y 路 由 选择 到 x，z 就 持续 地 向 y 讲述 这 个 善意 的 小 谎言 。 因 为 y 相信 z 没有 
Bl x 的 路 径 ， 故 只 要 z 继续 经 y 路 由 选择 到 x (并 这 样 去 撒谎 ) ，y 将 永远 不 会 试图 经 由 zx 
路 由 选择 到 xo 

我 们 现在 看 一 下 毒性 逆转 如 何 解 决 我 们 前 面 在 图 5-7b 中 遇 到 的 特定 环 路 问题 。 作 为 
毒性 逆转 的 结果 ，y 的 距离 表 指 示 了 D.(x) =e, 4 (x, y) 链 路 的 开销 在 to 时 刻 从 4 变 
为 60 时 ，y 更 新 其 表 ， 虽 然 开 销 高 达 60， 仍 继续 直接 路 由 选择 到 *， 并 将 到 x 的 新 开销 通 
知 z， 即 D,(x) =60, z Æt, 时 刻 收 到 更 新 后 ， 便 立即 将 其 到 x 的 路 由 切换 到 经 过 开销 为 50 
的 直接 (z, x) 链 路 。 因 为 这 是 一 条 新 的 到 x 的 最 低 开 销路 径 ， 且 因为 路 径 不 再 经 过 y，z 
就 在 t, 时 刻 通 知 y 现在 D.(x) =50。 在 收 到 来 自 z 的 更 新 后 ，y 便 用 D,(x) =51 更 新 其 距 
离 表 。 另 外 ， 因 为 z 此 时 位 于 y 到 % 的 最 低 开 销路 径 上 ， 所 以 y 通过 在 i 时 刻 通知 z 其 
D(x) =o (即使 y 实 际 上 知道 D,(x) =51) 毒化 从 z 到 *x 的 逆向 路 径 。 

毒性 逆转 解决 了 一 般 的 无 穷 计数 问题 吗 ? 没有 。 你 应 认识 到 涉及 3 个 或 更 多 节点 (而 
不 只 是 两 个 直接 相连 的 邻居 节点 ) 的 环 路 将 无 法 用 毒性 逆转 技术 检测 到 。 

3. LS 与 DV 路 由 选择 算法 的 比较 

DV 和 LS 算法 采用 互补 的 方法 来 解决 路 由 选择 计算 问题 。 在 DV REP, BS TAR 
与 它 的 直接 相连 的 邻居 交谈 ， 但 它 为 其 邻居 提供 了 从 它 自己 到 网 络 中 ( 它 所 知道 的 ) 所 有 
其 他 节点 的 最 低 开 销 估 计 。LS 算法 需要 全 局 信息 。 因 此 ， 当 在 每 台 路 由 器 中 实现 时 ， 例 
如 像 在 图 4-2 和 图 5-1 中 那样 ， 每 个 节点 (经 广播 ) 与 所 有 其 他 节点 通信 ， 但 仅 告 诉 它们 
与 它 直接 相连 链 路 的 开销 。 我 们 通过 快速 比较 它们 各 自 的 属性 来 总 结 所 学 的 链 路 状态 与 距 
离 向 量 算法 。 记 住 Y 是 节点 (路 由 器 ) 的 集合 , TE (HERR) 的 集合 。 

e 报 文 复杂 性 。 我 们 已 经 看 到 LS 算法 要 求 每 个 节点 都 知道 网 络 中 每 条 链 路 的 开销 。 
这 就 要 求 要 发 送 0(|N |1|E|) 个 报 文 。 而 且 无 论 何 时 一 条 链 路 的 开销 改变 时 ， 必 
须 向 所 有 节点 发 送 新 的 链 路 开销 。DYV 算法 要 求 在 每 次 迭代 时 ， 在 两 个 直接 相连 邻 
居 之 间 交 换 报 文 。 我 们 已 经 看 到 ， 算 法 收敛 所 需 时 间 依 赖 于 许多 因素 。 当 链 路 开销 
改变 时 ，DYV 算法 仅 当 在 新 的 链 路 开销 导致 与 该 链 路 相连 节点 的 最 低 开 销路 径 发 生 
改变 时 ， 才 传播 已 改变 的 链 路 开销 。 
收敛 速度 。 我 们 已 经 看 到 LS 算法 的 实现 是 一 个 要 求 0(|N | |E|) 个 报 文 的 
0(|N| ) 算 法 。DV 算法 收敛 较 慢 ， 且 在 收敛 时 会 遇 到 路 由 选择 环 路 。DV 算法 还 
会 遭遇 无 穷 计 数 的 问题 。 

e 健 半 性 。 如 果 一 台 路 由 需 发 生 故 障 、 行 为 错乱 或 受到 蓄意 破坏 时 情况 会 怎样 呢 ? 对 
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于 LS 算法 ， 路 由 器 能 够 向 其 连接 的 链 路 (而 不 是 其 他 链 路 ) 广播 不 正确 的 开销 。 
作为 LS 广播 的 一 部 分 ， 一 个 节点 也 可 损坏 或 丢弃 它 收 到 的 任何 LS 广播 分 组 。 但 是 
一 个 LS 节点 仅 计 算 目 己 的 转发 表 ; 其 他 节点 也 目 行 执行 类 似 的 计算 。 这 就 意味 着 
在 LS 算法 下 ， 路 由 计算 在 某 种 程度 上 是 分 离 的 ， 提 供 了 一 定 程度 的 健壮 性 。 在 DV 
算法 下 ， 一 个 节点 可 向 任意 或 所 有 目的 节操 通告 其 不 正确 的 最 低 开 销路 径 。 (在 
1997 年 ， 一 个 小 ISP 的 一 台 有 故障 的 路 由 器 的 确 加 美国 的 主干 路 由 器 提供 了 错误 的 
路 由 选择 信息 。 这 引起 了 其 他 路 由 器 将 大 量 流量 引 加 该 故障 路 由 器 ， 并 导致 因特网 
的 大 部 分 中 断 连 接 达 数 小 时 [Neumann 1997j。) 更 一 般 地 ， 我 们 会 注意 到 每 次 迭 
代 时 ， 在 DV 算法 中 一 个 节点 的 计算 会 传递 给 它 的 邻居 ， 然 后 在 下 次 迭代 时 再 间接 
地 传递 给 邻居 的 邻居 。 在 此 情况 下 ，DV 算法 中 一 个 不 正确 的 节点 计算 值 会 扩散 到 
整个 网 络 。 
总 之 ， 两 个 算法 没有 一 个 是 明显 的 赢家 ， 它 们 的 确 都 在 因特网 中 得 到 了 应 用 。 


5.3 因特网 中 自治 系统 内 部 的 路 由 选择 : OSPF 


在 我 们 至 今 为 止 的 算法 研究 中 ， 我 们 将 网 络 只 看 作 一 个 互联 路 由 器 的 集合 。 从 所 有 路 
由 器 执行 相同 的 路 由 选择 算法 以 计算 穿越 整个 网 络 的 路 由 选择 路 径 的 意义 上 来 说 ， 一 台 路 
由 器 很 难 同 另 一 台 路 由 器 区 别 开 来 。 在 实践 中 ， 该 模型 和 这 种 一 组 执行 同样 路 由 选择 算法 
的 同 质 路 由 器 集合 的 观点 有 一 点 简单 化 ， 有 以 下 两 个 重要 原因 : 

。 规模 。 随 着 路 由 器 数目 变 得 很 大 ， 涉 及 路 由 选择 信息 的 通信 、 计 算 和 存储 的 开销 将 
高 得 不 可 实现 。 当 今 的 因特网 由 数 亿 台 主机 组 成 。 在 这 些 主 机 中 存储 的 路 由 选择 信 
息 显然 需要 巨大 容量 的 内 存 。 在 所 有 路 由 器 之 间 广 播 连通 性 和 链 路 开销 更 新 所 要 求 
的 负担 将 是 巨大 的 ! 在 如 此 大 量 的 路 由 器 中 和 迭代 的 距离 向 量 算法 将 肯定 永远 无 法 收 
SHY 显然 ， 必 须 采 取 一 些 措 施 以 减少 像 因 特 网 这 种 大 型 网 络 中 的 路 由 计算 的 复 
杂 性 。 
管理 自治 。 如 在 1. 3 节 描 述 的 那样 ， 因 特 网 是 ISP 的 网 络 ， 其 中 每 个 ISP 都 有 它 自 
己 的 路 由 器 网 络 。ISP 通常 希望 按 自己 的 意愿 运行 路 由 器 ( 如 在 目 己 的 网 络 中 运行 
它 所 选择 的 某 种 路 由 选择 算法 ) ， 或 对 外 部 隐藏 其 网 络 的 内 部 组 织 面貌 。 在 理想 情 
况 下 ， 一 个 组 织 应 当 能 够 按 自己 的 愿望 运行 和 管理 其 网 络 ， 还 要 能 将 其 网 络 与 其 他 
外 部 网 络 连接 起 来 。 

这 两 个 问题 都 可 以 通过 将 路 由 器 组 织 进 自治 系统 (Autonomous System, AS) 来 解决 ， 
其 中 每 个 AS 由 一 组 通常 处 在 相同 管理 控制 下 的 路 由 器 组 成 。 通 常 在 一 个 ISP 中 的 路 由 天 
以 及 互联 它们 的 链 路 构成 一 个 AS。 然而 ， 某 些 ISP 将 它们 的 网 络 划分 为 多 个 AS。 特 别 是 ， 
某 些 一 级 ISP 在 其 整个 网 络 中 使 用 一 个 庞大 的 AS， 而 其 他 ISP 则 将 它们 的 ISP 拆 分 为 数 十 
个 互联 的 AS。 一 个 自治 系统 由 其 全 局 唯一 的 AS (ASN) 所 标识 [RFC 1930], Wii% IP 
地 址 那样 ，AS 号 由 ICANN 区 域 注 册 机 构 所 分 配 [ICANN 2016]. 

在 相同 AS 中 的 路 由 器 都 运行 相同 的 路 由 选择 算法 并 且 有 彼此 的 信息 。 在 一 个 自治 系 
统 内 运行 的 路 由 选择 算法 叫 作 自治 系统 内 部 路 由 选择 协议 (intra- autonomous system routing 


protocol ) 。 


开放 最 短路 优先 (OSPF) 
OSPF 路 由 选择 及 其 关系 密切 的 协议 IS-IS 都 被 广泛 用 于 因特网 的 AS 内 部 路 由 选 
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fE, OSPF 中 的 开放 (open) 一 词 是 指 路 由 选择 协议 规范 是 公众 可 用 的 (与 之 相反 的 
是 Cisco 的 EIGRP 协议 ， 该 协议 在 最 近 才 成 为 开放 的 [Savage 2015 ] ， 它 作为 Cisco 专 
用 协议 大 约 有 20 年 时 间 ) 。OSPF 的 最 新 版 本 是 版 本 2， 由 [RFC 2328] 这 个 公用 文 
档 所 定义 。 

OSPF 是 一 种 链 路 状态 协议 ， 它 使 用 洪 泛 链 路 状态 信息 和 Dijkstra 最 低 开 销路 径 算 法 。 
使 用 OSPF， 一 台 路 由 器 构建 了 一 幅 关 于 整个 自治 系统 的 完整 拓扑 图 ( 即 一 幅 图 )。 于 是 ， 
每 台 路 由 器 在 本 地 运行 Dijkstra 的 最 短路 径 算 法 ， 以 确定 一 个 以 自身 为 根 节点 到 所 有 子 网 
的 最 短路 径 树 。 各 条 链 路 开销 是 由 网 络 管理 员 配 置 的 (参见 “实践 原则 : 设置 OSPF 链 路 
权 值 ”) 。 管 理 员 也 许 会 选择 将 所 有 链 路 开销 设 为 1， 因 而 实现 了 最 少 跳 数 路 由 选择 ， 或 者 
可 能 会 选择 将 链 路 权 值 按 与 链 路 容量 成 反比 来 设置 ， 从 而 不 鼓励 流量 使 用 低 带 宽 链 路 。 
OSPF 不 强制 使 用 设置 链 路 权 值 的 策略 〈( 那 是 网 络 管理 员 的 任务 ) ， 而 是 提供 了 一 种 机 制 
(协议 ) ， 为 给 定 链 路 权 值 集合 确定 最 低 开 销路 径 的 路 由 选择 。 

使 用 OSPF 时 ， 路 由 需 向 自治 系统 内 所 有 其 他 路 由 器 广 播 路 由 选择 信息 ， 而 不 仅仅 是 
向 其 相 邻 路 由 器 广播 。 每 当 一 条 链 路 的 状态 发 生变 化 时 (如 开销 的 变化 或 连接 /中 断 状态 
的 变化 ) ， 路 由 器 就 会 广播 链 路 状态 信息 。 即 使 链 路 状态 未 发 生变 化 ， 它 也 要 周期 性 地 
(至 少 每 隔 30 min 一 次 ) 广播 链 路 状态 。RFC 2328 中 有 这 样 的 说 明 :“ 链 路 状态 通告 的 这 
种 周期 性 更 新 增加 了 链 路 状态 算法 的 健壮 性 。”OSPF 通告 包含 在 OSPF 报 文中 ,该 OSPF 
报 文 直接 由 IP 承载 ， 对 OSPF 其 上 层 协 议 的 值 为 89。 因 此 OSPF 协议 必须 自己 实现 诸如 可 
靠 报 文 传输 、 链 路 状态 广播 等 功能 。OSPF 协议 还 要 检查 链 路 正在 运行 (通过 向 相连 的 邻 
居 发 送 HELLO 报 文 )， 并 允许 OSPF 路 由 器 获得 相 邻 路 由 器 的 网 络 范围 链 路 状态 的 数 
据 库 。 

OSPF 的 优点 包括 下 列 几 方面 : 

e 安全 。 能 够 鉴别 OSPF 路 由 器 之 间 的 交换 (如 链 路 状态 更 新 ) 。 使 用 鉴别 ， 仅 
有 受信 任 的 路 由 器 能 参与 一 个 AS 内 的 OSPF 协议 ， 因 此 可 防止 恶意 人 侵 者 
(或 正在 利用 新 学 的 知识 到 处 试探 的 网 络 专业 的 学 生 ) 将 不 正确 的 信息 注入 路 
由 器 表 内 。 在 默认 状态 下 ， 路 由 器 间 的 OSPF 报 文 是 未 被 鉴别 的 并 能 被 伪造 。 
能 够 配置 两 类 鉴别 ， 即 简单 的 和 MDS 的 (参见 第 8 章 有 关 MDS 和 鉴别 的 一 般 
性 讨论 ) 。 使 用 简单 的 鉴别 ， 每 台 路 由 器 配置 相同 的 口令 。 当 一 台 路 由 器 发 送 
一 个 OSPF 分 组 ， 它 以 明文 方式 包括 了 口令 。 显 然 ， 简 单 鉴 别 并 不 是 非常 安全 。 
MDS 鉴别 基于 配置 在 所 有 路 由 器 上 的 共享 秘密 密 钥 。 对 发 送 的 每 个 OSPF 分 
组 ， 路 由 器 对 附加 了 秘密 密 钥 的 OSPF 分 组 内 容 计 算 MDS 散 列 值 (参见 第 8 章 
中 报 文 鉴 别 码 的 讨论 ) 。 然 后 路 由 器 将 所 得 的 散 列 值 包括 在 该 OSPF 分 组 中 。 
接收 路 由 器 使 用 预 配 置 的 秘密 密 钥 计 算出 该 分 组 的 MDS 散 列 值 ， 并 与 该 分 组 
携带 的 散 列 值 进 行 比较 ， 从 而 验证 了 该 分 组 的 真实 性 。 在 MDS 鉴别 中 也 使 用 
了 序号 对 重 放 攻 击 进行 保护 。 

多 条 相同 开销 的 路 径 。 当 到 达 某 目的 地 的 多 条 路 径 具 有 相同 的 开销 时 ，OSPF 允许 
使 用 多 条 路 径 (这 就 是 说 ， 当 存在 多 条 相等 开销 的 路 径 时 ， 无 须 仅 选择 单一 的 路 径 
来 承载 所 有 的 流量 ) 。 

对 单 播 与 多 播 路 由 选择 的 综合 支持 。 多 播 OSPF (MOSPF) [RFC 1584] 提供 对 OS- 
PF 的 简单 扩展 ， 以 便 提供 多 播 路 由 选择 。MOSPF 使 用 现 有 的 OSPF 链 路 数据 库 ， 
并 为 现 有 的 OSPF 链 路 状态 广播 机 制 增加 了 一 种 新 型 的 链 路 状态 通告 。 
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e 支持 在 单个 AS 中 的 层次 结构 。 一 个 OSPF 自治 系统 能 够 层次 化 地 配置 多 个 区 域 。 
每 个 区 域 都 运行 自己 的 OSPF 链 路 状态 路 由 选择 算法 ， 区 域内 的 每 台 路 由 器 都 癌 该 
区 域内 的 所 有 其 他 路 由 器 广播 其 链 路 状态 。 在 每 个 区 域内 ， 一 人 台 或 多 台 区 域 边界 路 
由 器 负责 为 流向 该 区 域 以 外 的 分 组 提供 路 由 选择 。 最 后 ， 在 AS 中 只 有 一 个 OSPF 
区 域 配 置 成 主干 区 域 。 主 干 区 域 的 主要 作用 是 为 该 AS 中 其 他 区 域 之 间 的 流量 提供 
路 由 选择 。 该 主干 总 是 包含 本 AS 中 的 所 有 区 域 边界 路 由 器 ， 并 且 可 能 还 包含 了 一 
些 非 边界 路 由 器 。 在 AS 中 的 区 域 间 的 路 由 选择 要 求 分 组 先 路 由 到 一 个 区 域 边 界 路 
由 器 〈 区 域内 路 由 选择 ) ， 然 后 通过 主干 路 由 到 位 于 目的 区 域 的 区 域 边界 路 由 需 ， 
进而 再 路 由 到 最 终 目 的 地 。 

OSPF 是 一 个 相当 复杂 的 协议 ， 而 我 们 这 里 的 讨论 是 十 分 简要 的 ， [Huitema 1998; 

Moy 1998; RFC 2328] 提供 了 更 多 的 细节 。 
















设置 OSPF 链 路 权 值 


我 们 有 关 链 路 状态 路 由 选择 的 讨论 隐 含 地 假设 了 下 列 事 实 : 链 路 权重 已 经 设置 好 
了 ， 运 行 诸 如 OSPF 这 样 的 路 由 选择 算法 ,流量 根据 由 LS 算法 计算 所 得 的 路 由 选择 表 流 
动 。 就 因果 而 言 ， 给 定 链 路 权重 〈( 即 它们 先 发 生 ) ， 结 果 得 到 (经 Dijkstra 算法 ) 最 小 | 
化 总 体 开 销 的 路 由 选择 路 径 。 从 这 个 角度 看 ， 链 路 权重 反映 了 使 用 一 条 链 路 的 开销 ( 例 
如 ， 如 果 链 路 权重 与 容量 成 反比 ， 则 使 用 高 容量 链 路 将 具有 较 小 的 权重 并 因此 从 路 由 选 
择 的 角度 更 有 吸引 力 ) HAGA Dijkstra 算法 使 得 总 开销 为 最 小 。 

在 实践 中 ， 链 路 权重 和 路 由 选择 路 径 之 间 的 因果 关系 也 许 是 相反 的 ， 网 络 操作 员 配 
置 链 路 权重 ， 以 获取 某 些 流量 工程 目标 的 路 由 选择 路 径 [Fortz 2000; Fortz 2002 ] 。 例 
如 ， 假 设 某 网 络 操作 员 具 有 在 每 个 入 口 点 进入 和 发 向 每 个 出 口 点 的 该 网 络 的 流量 估计 。 
该 操作 员 接 下 来 可 能 要 设置 特定 入 口 到 出 口 的 流 路 由 选择 ， 以 最 小 化 经 所 有 网 络 链 路 的 
最 大 利用 率 。 但 使 用 如 OSPF 这 样 的 路 由 选择 算法 ， 操 作 员 调节 网 络 流 的 路 由 选择 的 主 
要 手段 就 是 链 路 权重 。 因 此 ， 为 了 取得 最 小 化 最 大 链 路 利用 率 的 目标 ， 操 作 员 必须 找 出 
取得 该 目标 的 链 路 权重 集合 。 这 是 一 种 相反 的 因果 关系 ， 即 所 希望 的 流 路 由 选择 已 知 ， 
必须 找到 OSPF 链 路 权重 ,使 得 该 OSPF 路 由 选择 算法 导致 这 种 希望 的 流 路 由 选择 。 








5.4 ISP 之 间 的 路 由 选择 : BGP 


我 们 刚才 学 习 了 OSPF 是 一 个 AS 内 部 路 由 选择 协议 。 当 在 相同 AS 内 的 源 和 目的 地 之 
间 进 行 分 组 选 路 时 ， 分 组 遵循 的 路 径 完 全 由 AS 内 路 由 选择 协议 所 决定 。 然 而 ， 当 分 组 跨 
越 多 个 AS 进行 路 由 时 ， 比 如 说 从 位 于 马里 廷 巴克 图 的 智能 手机 到 位 于 美国 硅谷 数据 中 心 
的 一 台 服 务 器 ， 我 们 需要 一 个 自治 系统 间 路 由 选择 协议 (inter- autonomous system routing 
protocol), AX AS 间 路 由 选择 协议 涉及 多 个 AS 之 间 的 协调 ， 所 以 AS 通信 必须 运行 相同 
的 AS 间 路 由 选择 协议 。 在 因特网 中 ， 所 有 的 AS 运行 相同 的 AS 间 路 由 选择 协议 ， 称 为 边 
界 网 关 协 议 (Broder Gateway Protocol, BGP) [RFC 4271; Stewart 1999 | 。 

BGP 无 疑 是 所 有 因特网 协议 中 最 为 重要 的 (唯一 竞争 者 可 能 是 我 们 已 经 在 4.3 节 中 学 
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习 的 下 协议 ) ， 因 为 正 是 这 个 协议 将 因特网 中 数 以 千 计 的 ISP 黏合 起 来 。 如 我 们 将 看 到 的 
那样 ，BGP 是 一 种 分 布 式 和 异步 的 协议 ,与 5.2.2 节 中 描述 的 距离 向 量 路 由 选择 协议 一 脉 
相 承 。 尽 管 BCP 是 一 种 复杂 和 富有 挑战 性 的 协议 , 但 为 了 深层 次 理解 因特网 ， 我 们 需要 
熟悉 它 的 基础 结构 和 操作 。 我 们 专注 于 学 习 BGP 的 时 间 将 是 物 有 所 值 的 。 


5.4.1 BGP 的 作用 


为 了 理解 BGP 的 职责 所 在 ， 考 虑 一 个 AS 和 在 该 AS 中 的 任意 一 个 路 由 器 。 前 面 讲 过 ， 
每 台 路 由 器 具有 一 张 转发 表 ， 该 转发 表 在 将 到 达 分 组 转发 到 出 路 由 器 链 路 的 过 程 中 起 着 主 
要 作用 。 如 我 们 已 经 学 习 过 的 那样 ， 对 于 位 于 相同 AS 中 的 目的 地 而 言 ， 在 路 由 需 转 发 表 
中 的 表 项 由 AS 内 部 路 由 选择 协议 所 决定 。 而 对 于 位 于 该 AS 外 部 的 目的 地 而 言情 况 如 何 
呢 ? 这 正 是 BGP 用 武之 地 。 

在 BGP 中 ， 分 组 并 不 是 路 由 到 一 个 特定 的 目的 地 址 ， 相 反 是 路 由 到 CIDR 化 的 前 级 ， 
其 中 每 个 前 绥 表 示 一 个 子 网 或 一 个 子 网 的 集合 。 在 BGP 的 世界 中 ， 一 个 目的 地 可 以 采用 
138. 16. 68/22 的 形式 ， 对 于 这 个 例子 来 说 包括 1024 个 IP 地 址 。 因 此 ， 一 台 路 由 器 的 转发 
表 将 具有 形式 为 (x，7) 的 表 项 ， 其 中 x 是 一 个 前 组 (例如 138. 16.68/22), 1 是 该 路 由 
器 的 接口 之 一 的 接口 号 。 

作为 一 种 AS 间 的 路 由 选择 协议 ，BGP 为 每 台 路 由 器 提供 了 一 种 完成 以 下 任务 的 手段 : 

1) 从 邻居 AS 获得 前 级 的 可 达 性 信息 。 特 别 是 ，BGP 允许 每 个 子 网 向 因特网 的 其 余部 
分 通告 它 的 存在 。 一 个 子 网 高 声 宣布 “我 存在 ,我 在 这 里 ”， 而 BGP 确保 在 因特网 中 的 所 
有 AS 知道 该 子 网 。 如 果 没 有 BOP 的 话 ， 每 个 子 网 将 是 隔离 的 孤岛 ， 即 它们 孤独 地 存在 ， 
不 为 因特网 其 余部 分 所 知 和 所 达 。 

2) 确定 到 该 前 缓 的 “最 好 的 ”路 由 。 一 台 路 由 器 可 能 知道 两 条 或 更 多 条 到 特定 前 绥 
的 不 同 路 由 。 为 了 确定 最 好 的 路 由 ， 该 路 由 器 将 本 地 运行 一 个 BGP 路 由 选择 过 程 (使 用 
它 经 过 相 邻 的 路 由 器 获得 的 前 缀 可 达 性 信息 ) 。 该 最 好 的 路 由 将 基于 策略 以 及 可 达 性 信息 
来 确定 。 

我 们 现在 钻研 BGP 如 何 执行 这 两 个 任务 。 


5. 4.2 通告 BGP 路 由 信息 


考虑 图 5-8 中 显示 的 网 络 。 如 我 们 看 到 的 那样 ， 这 个 简单 的 网 络 具 有 3 个 自治 系统 : 
AS1 、AS2 和 AS3 。 如 显示 的 那样 AS3 包括 一 个 具有 前 级 x 的 子 网 。 对 于 每 个 AS， 每 台 
路 由 器 要 么 是 一 台 网 关 路 由 器 (gateway router) ， 要 么 是 一 台 内 部 路 由 器 (internal router) 。 
网 关 路 由 器 是 一 台 位 于 AS 边缘 的 路 由 器 ， 它 直接 连接 到 在 其 他 AS 中 的 一 台 或 多 人 台 路 由 
需 。 内 部 路 由 器 仅 连 接 在 它 自己 AS 中 的 主机 和 路 由 需 。 例 如 ， 在 ASI PRR aE 1c 是 网 关 
路 由 器 ; 路 由 器 la、1b 和 1d 是 内 部 路 由 器 。 

我 们 考虑 这 样 一 个 任务 : 向 图 5-8 中 显示 的 所 有 路 由 器 通告 对 于 前 级 x 的 可 达 性 信 
息 。 在 高 层次 上 ， 这 是 简明 易 懂 的 。 首 先 ，AS3 向 AS2 发 送 一 个 BGP 报 文 ， 告 知 % 存在 
并 且 位 于 ASS 中 ; 我 们 将 该 报 文 表示 为 “AS3 x”。 然 后 AS2 向 AS] 发 送 一 个 BGP RX, 
告知 x 存在 并 且 能 够 先 通 过 AS2 然后 进入 AS3 进而 到 达 x; 我 们 将 该 报 文 表示 为 “AS2 
AS3 x”。 以 这 种 方式 ， 每 个 自治 系统 不 仅 知道 x 的 存在 ， 而 且 知 道 通 向 x 的 自治 系统 的 
路 径 。 
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图 5-8 具有 3 个 上 自治 系统 的 网 络 。AS3 包括 一 个 具有 前 绥 x 的 子 网 


虽然 在 图 5-8 中 有 关 通 告 BGP 可 达 性 信息 的 讨论 能 得 到 路 径 穿越 的 大 意 ， 但 就 自治 系 
统 彼此 并 未 实际 发 送 报 文 而 言 ， 它 并 不 是 准确 的 ， 相 反 是 路 由 硕 在 发 送 报 文 。 为 了 理解 这 
一 点 ， 我 们 现在 重 温 图 5-8 中 的 例子 。 在 BGP 中 ， 每 对 路 由 器 通过 使 用 179 端口 的 半 永 久 
TCP 连接 交换 路 由 选择 信息 。 每 条 直接 连接 以 及 所 有 通过 该 连接 发 送 的 BGP 报 文 ， 称 为 
BGP 连接 (BGP connection)。 此 外 ， 跨 越 两 个 AS 的 BGP 连接 称 为 外 部 BGP (eBGP) 连 
接 ， 而 在 相同 AS 中 的 两 台 路 由 器 之 间 的 BOP 会 话 称 为 内 部 BGP (iBGP) 连接 。 图 5-8 
所 示 网 络 的 BGP 连接 的 例子 显示 在 图 5-9 中 。 对 于 直接 连接 在 不 同 As 中 的 网 关 路 由 规 的 
每 条 链 路 而 言 ， 通 常 有 一 条 eBGP 连接 ; 因此 ， 在 图 5-9 中 ,在 网 关 路 由 器 lc 和 2a 之 间 
有 一 条 eBGP 连接 ， 而 在 网 关 路 由 器 2c 和 3a 之 间 也 有 一 条 eBGP 连接 。 

在 每 个 As 中 的 路 由 器 之 间 还 有 多 条 iBCP 连接 。 特 别 是 ， 图 5-9 显示 了 一 个 AS 内 部 
的 每 对 路 由 器 之 间 的 一 条 BGP 连接 的 通常 配置 ， 在 每 个 AS 内 部 产生 了 网 状 的 TCP 连接 。 
在 图 5-9 中 ，eBGP 会 话 显示 为 长 虚线 ，iBCP 显示 为 短 虚 线 。 注 意 到 iBGP 连接 并 不 总 是 与 
物理 链 路 对 应 。 


图 5-9 eBGP 和 1iBGCP 连接 


为 了 传播 可 达 性 信息 ， 使 用 了 iBGP 和 eBGP 会 话 。 再 次 考虑 向 AS1 和 AS2 中 的 所 有 
路 由 器 通告 前 级 x 的 可 达 性 信息 。 在 这 个 过 程 中 ， 网 关 路 由 需 3a 先 癌 网 关 路 由 器 2c 发 送 
一 个 eBGP 报 文 “AS3 x”。 网 关 路 由 器 2c 然后 向 AS2 中 的 所 有 其 他 路 由 器 (包括 网 关 路 
由 器 2a) 发 送 iBGP 报 文 “AS3 x”。 网 关 路 由 器 2a 接 下 来 回 网 关 路 由 需 1c 发 送 一 个 eBGP 
报 文 “AS2 AS3 x”。 最 后 ， 网 关 路 由 器 Ic 使 用 iBGP 向 ASI 中 的 所 有 路 由 器 发 送 报 文 
“AS2 AS3 x”。 在 这 个 过 程 完成 后 ， 在 ASI 和 AS2 中 的 每 个 路 由 器 都 知道 了 x 的 存在 并 且 
也 都 知道 了 通 往 x AY AS 路 径 。 
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当然 ， 在 真实 的 网 络 中 ， 从 某 个 给 定 的 路 由 器 到 某 个 给 定 的 目的 地 可 能 有 多 条 不 同 的 路 
径 ， 每 条 通过 了 不 同 的 AS 序列 。 例 如 ， 考 虑 图 5-10 所 示 的 网 络 ， 它 是 在 图 5-8 那个 初始 网 
络 基础 上 ， 从 路 由 天 1d SURGE ak 3d 附加 了 一 条 物理 链 路 。 在 这 种 情况 下 ， 从 ASI 到 x 有 两 
条 路 径 : 经 过 路 由 器 le 的 路 径 “AS2 AS3 x”; 以 及 经 过 路 由 天 ld 的 新 路 径 “AS3 x”, 





ASI NEXT-HOP AS3 
图 5-10 在 ASI 和 AS3 之 间 增 加 对 等 链 路 后 的 网 络 


5. 4.3 确定 最 好 的 路 由 


如 我 们 刚才 学 习 到 的 那样 ， 从 一 个 给 定 的 路 由 器 到 一 个 目的 子 网 可 能 有 多 条 路 径 。 事 
实 上 ， 因 特 网 中 的 路 由 器 常常 接收 到 很 多 不 同 的 可 能 路 径 的 可 达 性 信息 。 一 台 路 由 器 如 何 
在 这 些 路 径 之 间 进 行 选择 (并 且 再 相应 地 配置 它 的 转发 表 ) 呢 ? 

在 处 理 这 个 关键 性 问题 之 前 ， 我 们 需要 引入 几 个 BGP 术语 。 当 路 由 器 通过 BCP 连接 
通告 前 级 时 ， 它 在 前 级 中 包括 一 些 BGP 属性 (BGP attribute), H BGP 术语 来 说 ， 前 级 及 
其 属性 称 为 路 由 (route ) 。 两 个 较为 重要 的 属性 是 AS-PATH 和 NEXT- HOP。AS-PATH 属 
性 包含 了 通告 已 经 通过 的 AS 的 列表 ， 如 我 们 在 前 面 的 例子 中 所 见 。 为 了 生成 AS-PATH 的 
值 ， 当 一 个 前 级 通过 某 AS 时 ,该 AS 将 其 ASN 加 入 AS-PATH 中 的 现 有 列表 。 例 如 ， 在 图 
5-10 中 ， 从 ASI 到 子 网 x 有 两 条 路 : 其 中 一 条 使 用 AS-PATH “AS2 AS3”; 而 另 一 条 使 用 
AS-PATH“AS3”。BGP 路 由 器 还 使 用 AS-PATH 属性 来 检测 和 防止 通告 环 路 ; 特别 是 ， 如 
果 一 台 路 由 需 在 路 径 列 表 中 看 到 包含 了 它 自 己 的 AS， 它 将 拒绝 该 通告 。 

在 AS 间 和 AS 内 部 路 由 选择 协议 之 间 提 供 关 键 链 路 方面 ，NEXT- PATH 属性 具有 敏感 
而 重要 的 作用 。NEXT-HOP 是 AS-PATH 起 始 的 路 由 器 接口 的 IP 地址。 为 了 深入 理解 该 属 
性 ， 我 们 再 次 参考 图 5-10。 如 图 5-10 中 所 指示 的 那样 ， 对 于 从 ASI 通过 AS2 到 x 的 路 由 
“AS2 AS3 x”， 其 属性 NEXT- HOP 是 路 由 器 2a 左边 接口 的 IP 地址。 对 于 从 AS1 绕 过 AS2 
到 x 的 路 由 “AS3 x”, H NEXT- HOP 属性 是 路 由 器 3d 最 左边 接口 的 全 地址 。 总 的 说 来 ， 
在 这 个 假想 的 例子 中 ，AS1 中 的 每 台 路 由 器 都 知道 了 到 前 级 x 的 两 台 BCP 路 由 : 

路 由 器 2a 的 最 左 侧 接口 的 IP 地址 : AS2 AS3; x 
路 由 器 3d 的 最 左 侧 接口 的 IP debt: AS3; x 

这 里 ， 每 条 BGP 路 由 包含 3 NHIF: NEXT- HOP; ASPATH; 目的 前 级 。 在 实践 中 ， 
一 条 BCP 路 由 还 包括 其 他 属性 ， 眼 下 我 们 将 暂且 忽略 它 。 注 意 到 NEXT- HOP 属性 是 不 属 
于 AS] 的 某 路 由 器 的 IP 地 址 ; 然而 ， 包 含 该 IP 地 址 的 子 网 直接 连接 到 ASI 。 


1. 热 士 豆 路 由 选择 


终于 到 了 以 精确 的 方式 来 讨论 BGP 路 由 选择 算法 的 时 刻 了 。 我 们 将 以 一 个 最 简单 的 
路 由 选择 算法 开始 ， 即 热土 豆 路 由 选择 (hot potato routing) 。 
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考虑 在 图 5-10 网 络 中 的 路 由 器 1b。 如 同 刚才 所 述 ， 这 人 台 路 由 器 将 学 习 到 达 前 绥 x 的 
两 条 BGP 路 由 。 使 用 热土 豆 路 由 选择 ，( 从 所 有 可 能 的 路 由 中 ) 选择 的 路 由 到 开始 该 路 由 
的 NEXT-HOP 路 由 器 具有 最 小 开销 。 在 这 个 例子 中 ， 路 由 器 1b 将 查阅 它 的 AS 内 部 路 由 
选择 信息 ， 以 找到 通 往 NEXT-HOP 路 由 器 2a 的 最 低 开 销 AS 内 部 路 径 以 及 通 往 NEXT-HOP 
路 由 器 3d 的 最 低 开 销 AS 间 路 径 ， 进 而 选择 这 些 最 低 开 销路 径 中 具有 最 低 开 销 的 那 条 。 例 
如 ， 假 设 开 销 定义 为 穿越 的 链 路 数 。 则 从 路 由 器 1b 到 路 由 器 2a 的 最 低 开 销 是 2， 从 路 由 
ae lb 到 路 由 器 2d 的 最 低 开 销 是 3， 因 此 将 选择 路 由 器 2a。 路 由 器 1b 则 将 查阅 它 的 转发 表 
(HER AS 内 部 算法 所 配置 ) ， 并 且 找 到 通 往 路 由 器 2a 的 位 于 最 低 开 销路 径 上 的 接口 1 
lb 则 把 (x, J) 加 到 它 的 转发 表 中 。 

5-11 中 总 结 了 在 一 台 路 由 器 转发 表 中 对 于 热土 豆 路 由 选择 增加 AS 向 外 前 级 的 步 
又 。 注 意 到 下 列 问 题 是 重要 的 : 当 在 转发 表 中 增加 AS 向 外 前 级 时 ，AS 间 路 由 选择 协议 
(BGP) 和 AS 内 部 路 由 选择 协议 (如 OSPF) 都 要 用 到 。 


”使 用 来 自 AS 内 部 ee 
从 AS 间 协 议 学 协议 的 路 由 选择 信 热土 豆 路 由 选择 : ip 
到 经 多 个 网 关 可 一 息 ， 以 决定 到 这 每 一 远 择 具有 最 小 最 低 — ETAN 
达 子 网 x 个 网 关 的 最 低 开销 开销 的 网 关 rh epg 
路 径 的 开销 


图 5-11 在 路 由 需 转 发 表 中 增加 AS 外 部 目的 地 的 步骤 


热土 豆 路 由 选择 依据 的 思想 是 : 对 于 路 由 器 1b， 尽 可 能 快 地 将 分 组 送出 其 AS (更 明 
确 地 说 ， 用 可 能 的 最 低 开 销 ) ， 而 不 担心 其 AS 外 部 到 目的 地 的 余下 部 分 的 开销 。 就 “ 热 
土豆 路 由 选择 ”名 称 而 言 ， 分 组 被 类 比 为 烫手 的 热土 豆 。 因 为 它 烫手 ， 你 要 尽 可 能 快 地 将 
它 传 给 男 一 个 人 【( 男 一 个 AS)。 热 土豆 路 由 选择 因而 是 自私 的 算法 ， 即 它 试图 减 小 在 它 自 
cL AS 中 的 开销 ， 而 忽略 在 其 AS 之 外 的 端 到 端 开销 的 其 他 部 分 。 注 意 到 使 用 热土 豆 路 由 
选择 ， 对 于 在 相同 AS 中 的 两 台 路 由 器 ， 可 能 对 相同 的 前 组 选择 两 条 不 同 的 AS 路 径 。 例 
如 ， 我 们 刚才 看 到 路 由 器 Lb 到达 x 将 通过 AS2 发 送 分 组 。 而 路 由 器 1d 将 绕 过 AS2 并 直接 
m] AS3 发 送 分 组 到 达 x, 

2. 路 由 堪 选 择 算 法 

在 实践 中 ，BGP 使 用 了 一 种 比 热 土豆 路 由 选择 更 为 复杂 但 却 结合 了 其 特点 的 算法 。 对 
| 进入 BGP 的 路 由 选择 算法 的 输入 是 到 某 前 缀 的 所 有 路 由 的 集 

， 该 前 缀 是 已 被 路 由 器 学 习 和 接受 的 。 如 果 仅 有 一 条 这 样 的 路 由 ，BGCP 则 显然 选择 该 路 
i, 如 果 到 相同 的 前 级 有 两 条 或 多 条 路 由 ， 则 顺序 地 调用 下 列 消除 规则 直到 余下 一 条 
路 由 : 

1) 路 由 被 指派 一 个 本 地 偏好 (local preference) 值 作为 其 属性 之 一 (BT AS-PATH 和 
NEXT- HOP 以 外 ) 。 一 条 路 由 的 本 地 偏好 可 能 由 该 路 由 器 设置 或 可 能 由 在 相同 AS 中 的 另 一 台 
路 由 器 学 习 到 。 本 地 偏好 属性 的 值 是 一 种 策略 决定 ， 它 完全 取决 于 该 AS 的 网 络 管理 员 (我 
们 随后 将 更 为 详细 地 讨论 BCP 策略 问题 )。 具 有 最 高 本 地 偏好 值 的 路 由 将 被 选择 。 

2) 从 余下 的 路 由 中 (所 有 都 具有 相同 的 最 高 本 地 偏好 值 )， 将 选择 具有 最 短 AS- 
PATH 的 路 由 。 如 果 该 规则 是 路 由 选择 的 唯一 规则 ， 则 BGP 将 使 用 距离 向 量 算法 决定 路 
径 ， 其 中 距离 测度 使 用 AS BEA BRAT AN ER AEE AY BER 

3) 从 余下 的 路 由 中 (所 有 都 具有 相同 的 最 高 本 地 偏好 值 和 相同 的 AS- PATH KE), 
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使 用 热土 豆 路 由 选择 ， 即 选择 具有 最 靠近 NEXT- HOP 路 由 需 的 路 由 。 

4) 如 果 仍 留 下 多 条 路 由 ， 该 路 由 器 使 用 BGP 标识 符 来 选择 路 由 ， 参 见 [Stewart 1999], 

举 一 个 例子 ， 我 们 再 次 考虑 图 5-10 中 的 路 由 器 1b。 前 面 讲 过 到 前 级 x 确切 地 有 两 条 
BGP 路 由 ， 一 条 通过 AS2 而 男 一 条 绕 过 AS2。 前 面 也 讲 过 如 果 它 使 用 自己 的 热土 豆 路 由 选 
择 ， 则 BGP 将 通过 AS2 向 前 级 x 路 由 分 组 。 但 在 上 面 的 路 由 选择 算法 中 ， 在 规则 3 之 前 应 
用 了 规则 2， 导 致 BGP 选择 绕 过 AS2 的 那 条 路 由 ， 因 为 该 路 由 具有 更 短 的 AS-PATH。 因 此 
我 们 看 到 使 用 上 述 路 由 选择 算法 ，BGP 不 再 是 一 种 自私 的 算法 ， 即 它 先 查找 具有 短 AS 路 
径 的 路 由 (因而 很 可 能 减 小 端 到 端 时 延 ) 。 

如 上 所 述 ，BGP 是 因特网 AS 间 路 由 选择 事实 上 的 标准 。 要 查看 从 第 1 层 ISP 中 提取 
的 各 种 BGP 路 由 选择 表 (庞大 !)， 可 参见 http://www. routeviews. org, BGP 路 由 选择 表 通 
常 包含 超过 50 万 条 路 由 即 前 级 和 相应 的 属性 )。BGP 路 由 选择 表 的 规模 和 特征 的 统计 可 
在 | Potaroo 2016] 中 找到 。 


5.4.4 IP ÆW 


除了 作为 因特网 的 AS 间 路 由 选择 协议 外 ，BGP 还 常 被 用 于 实现 卫 任 播 (anycast) 服务 
[ RFC 1546, RFC 7094 ] ， 该 服务 通常 用 于 DNS 中 。 为 了 说 明 IP 任 播 的 动机 ， 考 虑 在 许多 应 
用 中 ， 我 们 对 下 列 情 况 感 兴趣 : 在 许多 分 散 的 不 同 地 理 位 置 ， 替 换 不 同 服务 器 上 的 相同 内 
容 ; 人 @ 让 每 个 用 户 从 最 靠近 的 服务 器 访问 内 容 。 例 如 ， 一 个 CDN 能 够 更 换 位 于 不 同 国家 、 
不 同 服务 器 上 的 视频 和 其 他 对 象 。 类 似 地 ，DNS 系统 能 够 在 遍及 全 世界 的 DNS 服务 器 上 复 
制 DNS 记录 。 当 一 个 用 户 要 访问 该 复制 的 内 容 ， 可 以 将 用 户 指向 具有 该 复制 内 容 的 “最 近 
的 ”服务 器 。BGP 的 路 由 选择 算法 为 做 这 件 事 提 供 了 一 种 最 为 容易 和 自然 的 机 制 。 

为 使 我 们 的 讨论 具体 ， 我 们 描述 CDN 可 能 使 用 中 任 播 的 方式 。 如 图 5-12 所 示 , 在 IP 
任 播 配 置 阶 段 ，CDN 公司 为 它 的 多 台 服 务 器 指派 相同 的 IP 地 址 ， 并 且 使 用 标准 的 BGP 从 
这 些 服务 器 的 每 台 来 通告 该 IP 地 址 。 当 某 台 BCP 路 由 器 收 到 对 于 该 IP 地 址 的 多 个 路 由 通 
告 ， 它 将 这 些 通 告 处 理 为 对 相同 的 物理 位 置 提供 不 同 的 路 径 (事实 上 ， 这 时 这 些 通 告 对 不 
同 的 物理 位 置 是 有 不 同 路 径 的 ) 。 当 配置 其 路 由 选择 表 时 ， 每 台 路 由 器 将 本 地 化 地 使 用 
BGP 路 由 选择 算法 来 挑选 到 该 IP 地 址 的 “最 好 的 ”( 例 如， 由 AS 跳 计 数 确定 的 最 近 的 ) 
路 由 。 例 如 ， 如 果 一 个 BOP 路 由 (对 应 于 一 个 位 置 ) 离 该 路 由 器 仅 一 AS 跳 的 距离 ， 并且 
所 有 其 他 BGP 路 由 (对 应 于 其 他 位 置 ) 是 两 AS 跳 和 更 多 AS 跳 ， 则 该 BCP 路 由 器 将 选择 
把 分 组 路 由 到 一 跳远 的 那个 位 置 。 在 这 个 初始 BCP 地 址 通告 阶段 后 ，CDN 能 够 进行 其 分 
发 内 容 的 主要 任务 。 当 某 客户 请 求 视频 时 ，CDN 向 该 客户 返回 由 地 理 上 分 散 的 服务 器 所 使 
用 的 共同 IP 地 址 ， 而 无 论 该 客户 位 于 何 处 。 当 该 客户 想 向 那个 IP 地 址 发 送 一 个 请 求 时 ， 
因特网 路 由 器 则 向 那个 “最 近 的 ”服务 器 转发 该 请 求 分 组 ， 最 近 的 服务 器 是 由 BGP 路 由 
选择 算法 所 定义 的 。 

尽管 上 述 CDN 的 例子 很 好 地 诠释 了 能 够 如 何 使 用 IP 任 播 ， 但 实践 中 CDN 通常 选择 不 
使 用 IP 任 播 ， 因 为 BGP 路 由 选择 变化 能 够 导致 相同 的 TCP 连接 的 不 同 分 组 到 达 Web 服务 
右 的 不 同 实例 。 但 IP 任 播 被 DNS 系统 广泛 用 于 将 DNS 请 求 指向 最 近 的 根 DNS ARF Ao 
2. 4 节 讲 过 ， 当 前 根 DNS 服务 器 有 13 个 IP 地 址 。 但 对 应 于 这 些 地 址 的 每 一 个 ， 有 多 个 
DNS 根 服 务 器 ， 其 中 有 些 地 址 具有 100 多 个 DNS 根 服务 器 分 散在 世界 的 各 个 角落 。 当 一 
个 DNS 请 求 向 这 13 个 IP 地 址 发 送 时 ， 使 用 IP 任 播 将 该 请 求 路 由 到 负责 该 地 址 的 最 近 的 
那个 DNS 根 服务 器 。 
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MASI Al AS4 接收 到 对 于 
212.21.21.21 的 BGP 通告 。 
因为 服务 器 B E, 故 向 其 
转发 







通告 


212.21.21.21 = 


CDN 
服务 器 B 
图 5-12 使 用 IP 任 播 将 用 户 引 向 最 近 的 CDN 服务 器 


5.4.5 路 由 选择 策略 


当 某 路 由 器 选择 到 目的 地 的 一 条 路 由 时 ，AS 路 由 选择 策略 能 够 胜 过 所 有 其 他 考虑 ， 
例如 最 短 AS 路 径 或 热土 豆 路 由 选择 。 在 路 由 选择 算法 中 ， 实 际 上 首先 根据 本 地 偏好 属性 
选择 路 由 ， 本 地 偏好 值 由 本 地 AS 的 策略 所 确定 。 

我 们 用 一 个 简单 的 例子 说 明 BGP 路 由 选择 策略 的 茶 些 基本 概念 。 图 5-13 显示 了 6 个 
互联 的 自治 系统 : A B,C, W XA 图 例 : 

Y。 重 要 的 是 注意 到 A、B、C、W、X 和 


~ 提供 商 网 络 
re fe 
YEAS, THAR HE. BRARAG WA Ls ee 
=a 客户 网 络 
W, XAY ÆA ISP, iA, BACE > 
主干 提供 商 网 络 。 我 们 还 要 假设 A、B i 
和 C 直接 向 彼此 发 送 流量 ， 并 向 它们 的 图 5-13 一 个 简单 的 BGP SER 


客户 网 络 提供 全 部 的 BCP 信息 。 所 有 进入 一 个 接 入 ISP 网 络 的 流量 必定 是 以 该 网 络 为 目的 
地 ， 所 有 离开 一 个 接 人 ISP 网 络 的 流量 必定 源 于 该 网 络 。W 和 YY 显然 是 接 入 ISP。X 是 一 
个 多 宿 接 入 ISP (multi-homed stub network) ， 因 为 它 是 经 由 两 个 不 同 的 提供 商 连 到 网 络 的 
其 余部 分 (这 种 方法 在 实践 中 变 得 越 来 越 普遍 )。 然 而 ， 就 像 W 和 YY 一 样 ，X 自身 必定 是 
进入 /离开 X 的 所 有 流量 的 源 / 目 的 地 。 但 这 种 桩 网 络 的 行为 是 如 何 实现 和 强制 实现 的 呢 ? 
X 如 何 防止 转发 B 与 C 之 间 的 流量 呢 ? 这 能 够 通过 控制 BGP 路 由 的 通告 方式 容易 地 实现 。 
特别 是 ，X 如 果 (向 其 邻居 B 和 C) 通告 它 没有 通 向 〈 除 自身 以 外 ) 任何 其 他 目的 地 的 路 
径 ， 那 么 它 将 起 到 一 个 接 入 IS 的 作用 。 这 就 是 说 ， 即 使 X 可 能 知道 一 条 路 径 ( 比如 说 
XCY) 能 到 达 网 络 Y， 它 也 将 不 把 该 条 路 径 通 告 给 B。 由 于 B 不 知道 X 有 一 条 路 径 到 YY， 
B 绝 不 会 经 由 X 转发 目的 为 Y (或 C) 的 流量 。 这 个 简单 的 例子 说 明了 如 何 使 用 一 条 选择 
的 路 由 通告 策略 来 实现 客户 /提供 商 路 由 选择 关系 。 

我 们 接 下 来 关注 一 个 提供 商 网 络 ， 比 如 自治 系统 B。 假 定 B 已 经 (从 A 处 ) 知道 了 A 
有 一 条 到 W 的 路 径 AW。B 因此 能 将 路 由 AW 安装 到 其 路 由 信息 库 中 。 显 然 ，B 也 想 癌 它 
的 客户 X 通告 路 径 BAW， 这 样 X 知道 它 能 够 通过 B 路 由 到 W。 但 是 ，B 应 该 将 路 径 BAW 
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通告 给 CM? 如 果 它 这 样 做 ， 则 C 可 以 经 由 BAW KES FW, WRA, BAC 都 是 
主干 提供 商 ， 而 了 B 也 许 正好 觉得 它 不 应 该 承担 在 A 5 C 之 间 传 送 流量 的 负担 (和 开销 )。 
B 可 能 有 理由 认为 ， 确保 C 能 经 过 A AC 之 间 的 直接 连接 引导 A 客户 的 来 去 流量 是 A AIC 
的 工作 〈 和 开销 ) 。 目 前 还 没有 强制 主干 ISP 之 间 如 何 路 由 选择 的 官方 标准 。 然 而 ， 商 业 
运行 的 ISP 们 都 遵从 的 一 个 经 验 法 则 是 : 任何 穿越 某 ISP 主干 网 的 流量 必须 是 其 源 或 目的 
(或 两 者 ) 位 于 该 ISP 的 茶 个 客户 网 络 中 ; 不 然 的 话 这 些 流量 将 会 免费 搭车 通过 该 ISP 的 
网 络 。 各 个 对 等 协定 〈 用 于 解决 前 面 提 到 的 问题 ) 通常 都 是 ISP 双方 进行 协商 ， 而 且 经 常 
是 对 外 保密 的 ; [Huston 1999a] 提供 了 关于 对 等 协定 的 有 趣 讨论 。 路 由 选择 策略 如 何 反映 
ISP 之 间 的 商业 关系 的 详细 描述 参见 [Gao 2001; Dmitiropoulos 2007], M ISP 的 立场 出 发 ， 
AK BCP 路 由 选择 策略 的 讨论 参见 [Caesar 2005b ] 。 

我 们 完成 了 对 BGP 的 简要 介绍 。 理 解 BGP 是 重要 的 ， 因 为 它 在 因特网 中 起 着 重要 作用 。 
我 们 鼓励 你 阅读 参考 文献 | Griffin 2012; Stewart 1999; Labovitz 1997; Halabi 2000; Huitema 
1998; Gao 2001; Feamster 2004; Caesar 2005b; Li 2007] ， 以 学 习 更 多 的 BGP 知识 。 

























为 什么 会 有 不 同 的 AS 间 和 AS 内 部 路 由 选择 协议 ? 


学 习 了 目前 部 署 在 因特网 中 的 特定 的 AS 间 和 AS 内 部 路 由 选择 协议 的 细节 后 ， 我 
们 可 通过 思考 对 这 些 协议 首先 会 问 的 也 许 最 为 根本 性 的 问题 来 得 到 结论 (希望 你 已 经 在 
思考 该 问题 ， 并 且 不 致 因 技 术 细 节 而 不 能 把 握 全 局 ) : 为 什么 所 使 用 的 AS 间 和 AS 内 部 
路 由 选择 协议 是 不 同 的 ? 

对 该 问题 的 答案 触及 了 AS 内 与 AS 间 的 路 由 选择 目标 之 间 差 别 的 本 质 : 

@ 策略 。 在 AS 之 间 ， 策 略 问 题 起 主导 作用 。 一 个 给 定 AS 产生 的 流量 不 能 穿 过 另 
一 个 特定 的 AS， 这 可 能 非常 重要 。 类 似 地 ， 一 个 给 定 AS 也 许 想 很 好 地 控制 它 承 
载 的 其 他 AS 之 间 穿 越 的 流量 。 我 们 已 看 到 ，BGP 承载 了 路 径 属 性 ， 并 提供 路 由 
选择 信息 的 受 控 分 布 ， 以 便 能 做 出 这 种 基于 策略 的 路 由 选择 决策 。 在 一 个 AS 内 
部 ， 一 切 都 是 在 相同 的 管理 控制 名 义 下 进行 的 ， 因 此 策略 问题 在 AS 内 部 选择 路 
由 中 起 着 微不足道 的 作用 。 

o 规模。 扩展 一 个 路 由 选择 算法 及 其 数据 结构 以 处 理 到 大 量 网 络 或 大 量 网 络 之 间 的 

| 路 由 选择 的 这 种 能 力 ， 是 AS 间 路 由 选择 的 一 个 关键 问题 。 在 一 个 AS 内 ， 可 扩 
展 性 不 是 关注 的 焦点 。 首 先 ， 如 果 单 个 ISP 变 得 太 大 时 ， 总 是 能 将 其 分 成 两 个 
| 
| 








AS， 并 在 这 两 个 新 的 AS 之 间 执 行 AS 间 路 由 选择 。 (Ait, OSPF 通过 将 一 
个 AS 分 成 区 域 而 建立 这 样 的 层次 结构 。) 

性 能 。 由 于 AS 间 路 由 选择 是 面向 策略 的 ， 因 此 所 用 路 由 的 质量 (如 性 能 ) 通 
常 是 次 要 关心 的 问题 ( 即 一 条 更 长 或 开销 更 高 但 能 满足 菜 些 策略 条 件 的 路 由 也 
许 被 采用 了 ， 而 更 短 但 不 满足 那些 条 件 的 路 由 却 不 会 被 采用 )。 我 们 的 确 看 到 
了 在 AS 之 间 ， 甚 至 没有 与 路 由 相关 的 开销 (除了 AS 跳 计 数 外 ) 概念 。 然 而 
在 一 个 AS 内 部 ， 这 种 对 策略 的 关心 就 不 重要 了 ， 可 以 使 路 由 选择 更 多 地 关注 
一 条 路 由 实现 的 性 能 级 别 。 
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5.4.6 拼装 在 一 起 : 在 因特网 中 呈现 


尽管 本 小 节 不 是 有 关 BO 本 身 的 ,但 它 将 我 们 到 此 为 止 看 到 的 许多 协议 和 概念 结合 
到 一 起 ， 包 括 IP Heh, DNS 和 BGP, 

假定 你 只 是 创建 了 一 个 具有 若干 服务 需 的 小 型 公司 网 络 ， 包 括 一 台 描 述 公 司 产品 和 服 
务 的 公共 Web 服务 器 ， 一 台 从 你 的 雇员 获得 他 们 的 电子 邮件 报 文 的 电子 邮件 服务 器 和 一 
台 DNS 服务 器 。 你 当然 乐意 整个 世界 能 够 访问 你 的 Web 站 点 ， 以 得 知 你 的 现 有 产品 和 服 
务 。 此 外 ， 你 将 乐意 你 的 雇员 能 够 向 遍及 世界 的 潜在 客户 发 送 和 接收 电子 邮件 。 

为 了 满足 这 些 目标 ， 你 首先 需要 获得 因特网 连接 ， 要 做 到 这 一 点 ， 需 要 与 本 地 ISP 签 
订 合 同 并 进行 连接 。 你 的 公司 将 有 一 台 网 关 路 由 器 ， 该 路 由 需 将 与 本 地 ISP 的 一 台 路 由 需 
相连 。 该 连接 可 以 是 一 条 通过 现 有 电话 基础 设施 的 DSL 连接 、 一 条 到 ISP 路 由 器 的 租用 
线 ， 或 者 是 第 1 章 描述 的 许多 其 他 接 人 解决 方案 之 一 。 你 的 本 地 ISP 也 将 为 你 提供 一 个 IP 
地 址 范围 ， 例 如 由 256 个 地 址 组 成 的 一 个 /24 地 址 范围 。 一 旦 你 有 了 自己 的 物理 连接 和 IP 
地 址 范围 ， 你 将 在 该 地 址 范围 内 分 配 IP 地 址 : 一 个 给 你 的 Web 服务 硕 ， 一 个 给 你 的 电子 
邮件 服务 器 ， 一 个 给 你 的 DNS 服务 器 ， 一 个 给 你 的 网 关 路 由 器 ， 并 将 其 他 P 地 址 分 配给 
公司 网 络 中 的 其 他 服务 器 和 联网 设备 。 

除了 与 一 个 ISP 签订 合同 外 ， 你 还 需要 与 一 个 因特网 注册 机 构 签订 合同 ， 以 便 为 你 的 
公司 获得 一 个 域名 ， 如 在 第 2 章 中 所 描述 的 那样 。 例 如 ， 如 果 你 的 公司 名 称 比 如 说 是 Xa- 
nadu Inc. ， 你 自然 希望 获得 域名 xanadu. com。 你 的 公司 还 必须 呈现 在 DNS 系统 中 。 具 体 
而 言 ， 因 为 外 部 世界 将 要 联系 你 的 DNS 服务 器 以 获得 该 服务 器 的 IP 地 址 ， 所 以 你 还 需要 
为 注册 机 构 提供 你 的 DNS 服务 器 的 IP 地址。 该 注册 机 构 则 在 . com RAINY ARS HEPA 
的 DNS 服务 器 设置 一 个 表 项 (域名 和 对 应 的 IP 地 址 )， 如 第 2 章 所 述 。 在 这 个 步骤 完成 
后 ， 任 何 知 道 你 的 域名 〈 例 如 xanadu. com) 的 用 户 将 能 够 经 过 DNS 系统 获得 你 DNS 服务 
ashy) IP 地 址 。 

为 了 使 人 们 能 够 发 现 你 的 Web 服务 需 的 IP 地 址 ， 你 需要 在 你 的 DNS 服务 器 中 包括 一 个 
将 你 的 Web 服务 器 的 主机 名 (例如 www. xanadu. com) 映射 到 它 的 正 地 址 的 表 项 。 你 还 要 为 
公司 中 其 他 公共 可 用 的 服务 器 设置 类 似 的 表 项 ， 包 括 你 的 电子 邮件 服务 器 。 如 此 一 来 ， 如 果 
Alice 要 浏览 你 的 Web 服务 器 ，DNS 系统 将 联系 你 的 DNS 服务 器 ， 找 到 你 的 Web 服务 器 的 
IP 地 址 ， 并 将 其 给 Alice。Alice 则 能 与 你 的 Web 服务 器 创建 一 个 直接 的 TCP 连接 。 

然而 ， 人 允许 来 自 世 界 各 地 的 外 部 人 员 访 问 你 的 Web 服务 器 ， 仍 然 还 有 一 个 必要 的 、 
决定 性 的 步 豫 。 考 虑 当 Alice 做 下 列 事情 发 生 的 状况 : Alice 知道 你 的 Web AR ah AY IP H 
址 ， 她 向 该 IP 地 址 发 送 一 个 IP 数据 报 ( 例 如 一 个 TCP SYN 报 文 段 ) 。 该 数据 报 将 通过 因 
特 网 进行 路 由 ， 经 历 了 在 许多 不 同 的 自治 系统 中 的 一 系列 路 由 器 ， 最 终 到 达 你 的 Web 服 
务 器 。 当 任何 一 个 路 由 器 收 到 该 数据 报时 ， 将 去 它 的 转发 表 中 寻找 一 个 表 项 来 确定 转发 该 
数据 报 的 外 出 端口 。 因 此 ， 每 台 路 由 器 需要 知道 你 公司 的 /24 前 级 (或 者 某 些 聚合 项 ) 。 
一 台 路 由 器 如 何 知 道 你 公司 的 前 级 呢 ?如 我 们 刚才 看 到 的 那样 ， 它 从 BGP 知道 了 该 前 缀 。 
具体 而 言 ， 当 你 的 公司 与 本 地 ISP 签订 合同 并 且 获 得 了 分 配 的 前 级 即 一 个 地 址 范围 )， 
你 的 本 地 ISP 将 使 用 BGP 向 与 之 连接 的 ISP 通告 你 的 前 级 。 这 些 ISP 将 依次 使 用 BGP 来 传 
播 该 通告 。 最 终 ， 所 有 的 因特网 路 由 器 将 得 知 了 你 的 前 级 (或 者 包括 你 的 前 级 的 某 个 聚合 
项 ) ， 因 而 能 够 将 数据 报 适当 地 转发 到 适当 的 Web 和 电子 邮件 服务 锋 。 


2.5 
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SDN 控制 平面 


在 本 节 中 ， 我 们 将 深入 SDN 控制 平面 ， 即 控制 分 组 在 网 络 的 SDN 使 能 设备 中 转发 的 
网 络 范围 逻辑 ， 以 及 这 些 设备 和 它们 的 服务 的 配置 与 管理 。 这 里 的 学 习 建 立 在 前 面 4.4 节 
中 一 般 化 SDN 转发 讨论 的 基础 上 ， 因 此 你 在 继续 学 习 前 需要 先 回顾 一 下 那 一 节 ， 以 及 本 
章 的 5. 1 节 。 如 同 4.4 节 中 一 样 ， 我们 将 再 次 采用 在 SDN 文献 中 所 使 用 的 术语 ， 将 网 络 的 
转发 设备 称 之 为 “分 组 交换 机 ”( 或 直接 称 为 交换 机 ， 理 解 时 带 上 “分 组 ”二 字 ) ， 因 为 
能 够 根据 网 络 层 源 /目的 地 址 、 链 路 层 源 /目的 地 址 以 及 运输 层 、 网 络 层 和 链 路 层 中 分 组 首 
部 字段 做 出 转发 决定 。 

SDN 体系 结构 具有 4 个 关键 特征 [ Kreutz 2015 ]: 


基于 流 的 转发 。SDN 控制 的 交换 机 的 分 组 转发 工作 ， 能 够 基于 运输 层 、 网 络 层 或 链 
路 层 首部 中 任意 数量 的 首部 字段 值 进行 。 在 4.4 A, 我们 看 到 了 OpenFlow 1.0 Hh 
象 允许 基于 11 个 不 同 的 首部 字段 值 进行 转 发 。 这 与 我 们 5.2 ~5.4 节 中 学 习 的 基于 
路 由 器 转发 的 传统 方法 形成 了 鲜明 的 对 照 ， 传 统 方法 中 IP 数据 报 的 转发 仅 依据 数 
据 报 的 目的 IP 地 址 进行 。 回 顾 图 5-2, 分 组 转发 规则 被 精确 规定 在 交换 机 的 流 表 
HA; SDN 控制 平面 的 工作 是 计算 、 管 理 和 安装 所 有 网 络 交 换 机 中 的 流 表 项 。 
数据 平面 与 控制 平面 分 离 。 这 种 分 离 明 显 地 显示 在 图 5-2 和 图 5-14 中 。 数 据 平 面 由 
网 络 交换 机 组 成 ， 交 换 机 是 相对 简单 〈 但 快速 ) 的 设备 ， 该 设备 在 它们 的 流 表 中 
执行 “匹配 加 动作 ”的 规则 。 控 制 平面 由 服务 器 以 及 决定 和 管理 交换 机 流 表 的 软 
件 组 成 。 
网 络 控制 功能 : 位 于 数据 平面 交换 机 外 部 。 考 虑 到 SDN 中 的 “S” 表 示 “ 软 件 ”， 
也 许 SDN 控制 平面 由 软件 实现 并 不 令 人 惊讶 。 然 而 ， 与 传统 的 路 由 器 不 同 ， 这 个 
软件 在 服务 器 上 执行 ， 该 服务 器 与 网 络 交 换 机 截然 分 开 且 与 之 远离 。 如 在 图 5- 14 
中 所 示 ， 控 制 平 面 自 身 由 两 个 组 件 组 成 : 一 个 SDN 控制 器 (或 网 络 操 作 系 统 
[ Gude 2008 ] ) ， 以 及 若干 网 络 控制 
应 用 程序 。 控 制 器 维护 准确 的 网 络 
状态 信息 〈 例 如， 远程 链 路 、 交 换 
机 和 主机 的 状态 ) ; 为 运行 在 控制 平 
面 中 的 网 络 控制 应 用 程序 提供 这 些 oy 
信息 ; Rik, ema Se 7 7 一 -北向 API 
过 这 些 方法 能 够 监视 、 编 程 和 控制 |) 。 
下 面 的 网 络 设备 。 尽 管 在 图 5-14 中 
的 控制 右 显 示 为 一 台 单 一 的 服务 器 ， 
但 实践 中 控制 器 仅 是 逻辑 上 集中 的 ， 
通常 在 几 台 服务 器 上 实现 ， 这 些 服 
务 器 提供 协调 的 、 可 扩展 的 性 能 和 让 Seed 
高 可 用 性 。 | a Se 
可 编程 的 网 络 。 通 过 运行 在 控制 平 ee cars iia 
给 bs Heal pà + BS 5-14 SDN 体系 结构 的 组 件 ，SDN 
mae 机 、SDN 控制 器 和 网 络 控制 应 用 程序 


网 络 控制 应 用 程序 





南 向 API 
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SDN 控制 平面 的 “智力 ”， 使 用 了 由 SDN 控制 器 提供 的 API 来 定义 和 控制 网 络 设备 
中 的 数据 平面 。 例 如 ， 一 个 路 由 选择 网 络 控制 应 用 程序 可 以 决定 源 和 目的 地 之 间 的 
端 到 端 路 径 〈 例 如 ， 通 过 使 用 由 SDN 控制 融 维 护 的 节点 状态 和 链 路 状态 信息 ， 执 
行 Dijkstra 算法 ) 。 另 一 个 网 络 应 用 程序 可 以 执行 访问 控制 ， 即 决定 交换 机 阻挡 哪个 
分 组 ， 如 4. 4.3 节 中 的 第 三 个 例子 那样 。 还 有 一 个 应 用 程序 可 以 用 执行 服务 器 负载 
均衡 的 方式 转发 分 组 〈4. 4. 3 节 中 我 们 考虑 的 第 二 个 例子 ) 。 
从 讨论 中 我 们 可 见 ，SDN 表示 了 一 种 意义 重大 的 网 络 功能 的 “分 类 ”， 即 数据 平面 交 
换 机 、SDN 控制 器 和 网 络 控 制 应 用 程序 是 分 离 的 实体 ， 该 实体 可 以 由 不 同 的 厂商 和 组 织 机 
构 所 提供 。 这 与 SDN 之 前 模式 形成 了 鲜明 对 照 , E SDN 之 前 模式 中 ， 交 换 机 /路 由 器 ( 连 
同 其 舱 入 的 控制 平面 软件 和 协议 实现 ) 是 一 个 整体 ， 它 是 垂直 、 综 合 的 ， 并 且 由 单一 的 三 
商 所 销售 。 在 SDN 中 的 这 种 网 络 功能 分 类 ， 可 以 与 大 型 计算 机 到 个 人 计算 机 的 早期 演化 
相 比 拟 ， 前 者 的 硬件 、 系 统 软 件 和 应 用 程序 是 由 单一 厂商 所 提供 的 ， 而 后 者 具有 各 自 的 人 硬 
件 、 操 作 系统 和 应 用 程序 。 计 算 人 硬件 、 系 统 软件 和 应 用 程序 的 分 类 ， 无 疑 已 经 在 所 有 这 三 
个 领域 的 创新 驱动 下 导致 了 丰富 、 开 放 的 生态 系统 。 对 SDN 的 希望 是 ， 它 也 将 导致 如 此 
丰富 的 创新 。 
给 出 了 我 们 对 图 5-14 的 SDN 体系 结构 的 理解 ， 自 然 会 产生 许多 问题 。 流 表 是 如 何 实 
际 计算 的 ， 以 及 在 哪里 进行 的 ? 响应 SDN 控制 的 设备 产生 的 事件 时 〈 例 如 ， 一 条 附属 链 
路 的 激活 /关闭 ) ， 这 些 流 表 是 如 何 更 新 的 呢 ? 在 协作 的 多 台 交 换 机 中 ， 流 表 项 是 如 何以 一 
种 导 臻 和谐、 一致 的 网 络 范围 功能 的 方式 进行 协作 的 呢 〈 例 如 ， 用 于 转发 分 组 的 从 源 到 目 
的 地 的 端 到 端 路 径 ， 或 与 分 布 式 防火 墙 协作 )? 提供 这 些 以 及 许多 其 他 能 力 是 SDN 控制 平 
面 的 作用 。 


5.5.1 SDN 控制 平面 : SDN 控制 器 和 SDN 网 络 控制 应 用 程序 


我 们 通过 考虑 控制 平面 必须 提供 的 一 般 能 力 开 始 抽象 地 讨论 SDN 控制 平面 。 如 我 们 
所 见 ， 这 种 抽象 即 “基本 原理 ”方法 将 我 们 引 回 一 个 总 体 的 体系 结构 ， 该 体系 结构 反映 了 
SDN 控制 平面 如 何在 实际 中 实现 。 

如 上 所 述 ，SDN 控制 平面 大 体 划 分 为 两 个 部 分 ， 即 SDN 控制 部 和 SDN 网 络 控制 应 用 
程序 。 我 们 先 来 仔细 考察 控制 器 。 自 从 最 早 的 SDN 控制 器 [Gude 2008] 开发 以 来 , 已 经 
研制 了 多 种 SDN 控制 器 ， 文 献 [Kreutz 2015] 极其 全 面 地 综述 了 最 新 进展 。 图 5-15 提供 
了 一 个 通用 SDN 控制 器 的 更 为 详尽 的 视图 。 控 制 絮 的 功能 可 大 体 组 织 为 3 个 层次 。 我 们 以 
一 种 非典 型 的 自 底 向 上 方式 考虑 这 些 层次 : 

o 通信 层 : SDN 控制 器 和 受 控 网 络 设备 之 间 的 通信 。 显 然 ， 如 果 SDN 控制 器 要 控制 

远程 SDN 使 能 的 交换 机 、 主 机 或 其 他 设备 的 运行 ， 需要 一 个 协议 来 传送 控制 器 与 
这 些 设备 之 间 的 信息 。 此 外 ,设备 必须 能 够 向 控 制 絮 传递 本 地 观察 到 的 事件 〈 例 
如 ， 一 个 报 文 指示 一 条 附属 链 路 已 经 激活 或 停止 ， 一 个 设备 刚刚 加 入 了 网 络 ， 或 一 
个 心跳 指示 某 设备 已 经 启动 和 运行 )。 这 些 事件 向 SDN 控制 器 提供 该 网 络 状 态 的 最 
新 视图 。 这 个 协议 构成 了 控制 句 体 系 结构 的 最 底层 ， 如 图 5-15 中 所 示 。 控 制 器 和 
受 挖 设备 之 间 的 通信 跨越 了 一 个 接口 ， 它 现在 被 称 为 控制 器 的 “ 南 向 ”接口 。 在 
5. 5.2 节 中 ,我们 将 学 习 OpenFlow， 它 是 一 种 提供 这 种 通信 功能 的 特定 协议 。 
OpenFlow 在 大 多 数 SDN 控制 句 中 得 到 了 实现 (即使 不 是 全 部 ) 。 

© 网 络 范围 状态 管理 层 。 由 SDN 控制 平面 所 做 出 的 最 终 控制 决定 (例如 配置 所 有 交 


ABE: R-P i 267 


换 机 的 流 表 以 取得 所 希望 的 端 到 端 转 发 ， 实 现 负 和 载 均衡 ， 或 实现 一 种 特定 的 防火 墙 
能 力 ) ， 将 要 求 控制 器 具有 有 关 网 络 的 主机 、 链 路 、 交 换 机 和 其 他 SDN 控制 设备 的 
最 新 状态 信息 。 交 换 机 的 流 表 包 含 计 数 器 ， 其 值 也 可 以 由 网 络 控制 应 用 程序 很 好 地 
使 用 ; 因此 这 些 值 应 当 为 应 用 程序 所 用 。 既 然 控制 平面 的 终极 目标 是 决定 用 于 各 种 
受 控 设 备 的 流 表 ， 控 制 器 也 就 可 以 维护 这 些 表 的 拷贝 。 这 些 信息 都 构成 了 由 SDN 
控制 器 维护 的 网 络 范围 “状态 ”的 例子 。 
对 于 网 络 控制 应 用 程序 层 的 接口 。 控 制 器 通过 它 的 “北向 ”接口 与 网 络 控制 应 
程序 交互 。 该 API 人 允许 网 络 控制 应 i a E, 
当 状 态 改变 事件 出 现时 ， 应 用 程序 能 够 注册 进行 通告 。 可 以 提供 不 同类 型 的 API， 
我 们 将 看 到 两 种 流行 SDN 控制 器 使 用 REST [ Fielding 2000] 请 求 响应 接口 与 它们 
的 应 用 程序 进行 通信 。 

我 们 已 经 提 到 过 几 次 ，SDN 控制 右 被 认为 是 “逻辑 上 集中 ”的 ， 即 该 控制 右 可 以 被 
外 部 视 为 一 个 单一 、 整 体 的 服务 (例如 ， 从 SDN 控制 设备 和 外 部 的 网 络 控制 应 用 程序 的 
角度 看 )。 然 而 ， 出 于 故障 容忍 、 高 可 用 性 或 性 能 等 方面 的 考虑 ， 在 实践 中 这 些 服务 和 用 
于 保持 状态 信息 的 数据 库 一 般 通 过 分 布 式 服务 器 集合 实现 。 在 服务 器 集合 实现 控制 郑 功 能 
时 ， 必 须 考 虑 控制 器 的 内 部 操作 (例如 维护 事件 的 逻辑 时 间 顺 序 、 一 致 性 、 意 见 一 致 等 ) 
的 语义 [Panda 2013 ] 。 这 些 关 注 点 在 许 
多 不 同 的 分 布 式 系统 中 都 是 共同 的 ， 这 
些 挑战 的 简洁 解决 方案 可 参见 | Lamport 
1989; Lampson 1996 ]。 诸 如 OpenDay- 
light 和 ONOS 这 样 的 现代 控制 器 已 经 将 
很 大 的 注意 力 放 在 构建 一 种 逻辑 上 集中 
但 物理 上 分 布 的 控制 硕 平 台 上 ， 该 平台 
提供 可 扩展 的 服务 和 对 受 控 设备 以 及 网 
络 控 制 应 用 程序 的 高 可 用 性 。 

在 图 5-15 中 描述 的 体系 结构 与 2008 
年 最 初 提出 的 NOX 控制 舌 [ Gude 2008 | 
以 及 今天 的 OpenDaylight | OpenDaylight 
Lithium 2016 | 和 ONOS [ ONOS 2016 | 
SDN 控制 器 (参见 插入 材料 ) 的 体系 结 
构 极 为 相似 。 我 们 将 在 5. 5.3 节 介 绍 一 
个 控制 右 操 作 的 例子 。 然 而 ， 我 们 先 来 
仔细 审视 OpenFlow 协议 ， 该 协议 位 于 控 we Ss 
制 器 的 通信 层 中 。 图 5-15 SDN 控制 器 的 组 件 
5.5.2 OpenFlow 协议 





OpenFlow 协议 [ OpenFlow 2009; ONF 2016] 运行 在 SDN 控制 器 和 SDN 控制 的 交换 
机 或 其 他 实现 OpenFlow API 的 设备 之 间 (OpenFlow API 我 们 在 4. 4 节 学 习 过 ) OpenFlow 
协议 运行 在 TCP 之 上 ， 使 用 6653 的 默认 端口 号 。 从 控制 器 到 受 控 交 换 机 流动 的 重要 报 文 
有 下 列 这 些 : 
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© 配置 。 该 报 文 允许 控制 器 查询 并 设置 交换 机 的 配置 参数 。 

© 修改 状态 。 该 报 文 由 控制 器 所 使 用 ， 以 增加 /删除 或 修改 交换 机 流 表 中 的 表 项 ， 并 
且 设置 交换 机 端口 特性 。 

© 读 状 态 。 该 报 文 被 控制 器 用 于 从 交换 机 的 流 表 和 端口 收集 统计 数据 和 计数 顺 值 。 

© 发 送 分 组 。 该 报 文 被 控制 器 用 于 在 受 控 交 换 机 从 特定 的 端口 发 送出 一 个 特定 的 
报 文 。 

从 受 控 交 换 机 到 控制 器 流动 的 重要 报 文 有 下 列 这 些 ，. 

o 流 删 除 。 该 报 文通 知 控制 右 已 删除 一 个 流 表 项 ， 例 如 由 于 超时 ， 或 作为 收 到 “修改 
状态 ” 报 文 的 结果 。 

© 端口 状态 。 交 换 机 用 该 报 文 回 控 制 右 通知 端口 状态 的 变化 。 

e 分 组 入 。4. 4 节 讲 过 ， 一 个 分 组 到 达 交 换 机 端口 ， 并 且 不 能 与 任何 流 表 项 匹配 ， 那 
么 这 个 分 组 将 被 发 送 给 控制 器 进行 额外 处 理 。 匹 配 的 分 组 也 被 发 送 给 控制 器 ， 作 为 
匹配 时 所 采取 的 一 个 动作 。“ 分 组 入 ” 报 文 被 用 于 将 分 组 发 送 给 控制 器 。 男 外 的 
OpenFlow 报 文 定义 在 [| OpenFlow 2009; ONF 2016] 中 。 





谷歌 的 软件 定义 全 球 网 络 


2.6 节 中 的 学 习 案 例 中 讲 过 ， 谷 歌 部 署 了 专用 的 广域网 (WAN) ， 该 网 互联 了 它 | 
(AL IXP fo ISP 中) 的 数据 中 心 和 服务 器 集群 。 这 个 称 为 B4 的 网 络 有 一 个 谷歌 基于 | 
OpenFlow 设计 的 SDN 控制 平面 。 谷 歌 网 络 能 够 在 长 途 线 路 上 以 接近 70% 的 利用 率 运 | 
行 WAN 链 路 (超过 典型 的 链 路 利用 率 的 2 ~3 倍 ) ， 并 且 基 于 应 用 优先 权 和 现 有 的 流 | 
需求 在 多 条 路 径 之 间 分 割 应 用 流 [Jain 2013 ] 。 特 别 是 ， 谷 歌 B4 MAAT SDN: 
DAIXP 和 ISP 中 的 边缘 服务 器 到 网 络 核心 中 的 路 由 器 ， 人 谷歌 控 制 了 所 有 的 设备 ; 
@) 带 宽 最 密集 的 应 用 是 场 点 之 间 的 大 规模 数据 拷贝， 这 种 数据 找 贝 在 资源 拥塞 期 间 能 ， 
够 “服从 ” 较 高 优先 权 的 交互 应 用 ; 国 由 于 仅 连接 了 几 十 个 数据 中 心 ， 集 中 式 控 制 是 
可 行 的 。 | 

谷歌 的 BA 网 络 使 用 定制 的 交换 机 ， 每 台 交 换 机 实现 了 OpenFlow 稍 加 扩充 的 版 本 ， 
具有 一 个 本 地 OpenFlow 代理 (OFA) ， 该 OFA 方法 上 类 似 于 我 们 在 图 5-2 中 遇 到 的 控制 
代理 。 每 个 OFA 又 与 网 络 控 制服 务 器 (NCS) 中 的 OpenFlow 控制 器 (OFC) 相连, 使 | 
用 一 个 分 离 的 “ 带 外 ”网 络 ， 与 在 数据 中 心 之 间 承 载 数据 中 心 流量 的 网 络 截 然 不 同 。 该 
OFC 因此 提供 由 NCS 使 用 的 服务 以 与 它 的 受 控 交换 机 通信 ， 方 法 上 类 似 于 显示 在 图 5- 
15 中 的 SDN 体系 结构 的 最 低层 。 在 B4 P, OFC 也 执行 状态 管理 功能 ， 在 网 络 信 息 库 
(NIB) 中 保持 节点 和 和 链 路 状态 。OFC 的 谷歌 实现 基于 ONIX SDN 控制 器 [Koponen | 
2010 ] 。 实 现 了 两 种 路 由 选择 协议 : 用 于 数据 中 心 之 间 路 由 选择 的 BCP 和 用 于 数据 中 心 
内 部 路 由 选择 的 IS-IS (非常 接近 OSPF), Paxos | Chandra 2007] 用 于 执行 NCS 组 件 的 
热 复制 ， 以 防止 故障 。 

一 种 逻辑 上 置 于 网 络 控 制服 务 器 集合 之 上 的 流量 工程 网 络 控 制 应 用 ,与 这 些 服 务 器 ， 
交互 ， 以 为 一 组 应 用 流 提 供 全 局 、 网 络 范 围 的 带宽 。 借 助 于 B4，SDN 一 举 跨 入 全 球 网 
络 提 供 商 的 运行 网 络 的 行列 。B4 的 详细 描述 请 参见 [Jain 2013], 
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5.5.3 数据 平面 和 控制 平面 交互 的 例子 


为 了 具体 地 理解 SDN 控制 的 交换 机 与 SDN 控制 器 之 间 的 交互 ， 我 们 考虑 图 5-16 中 所 
示 的 例子 ， 其 中 使 用 了 Dijkstra 算法 (该 算法 我 们 已 在 5.2 节 中 学 习 过 ) 来 决定 最 短路 径 
路 由 。 图 5-16 中 的 SDN 场景 与 前 面 5.2.1 节 和 5.3 节 中 描述 的 每 路 由 器 控制 场景 有 两 个 
重要 差异 ，Dijkstra 算法 是 实现 在 每 台 
路 由 器 中 并 且 在 所 有 网 络 路 由 器 中 洪 泛 
链 路 状态 更 新 : 
© Dijkstra 算法 作为 一 个 单独 的 程 
序 来 执行 ， 位 于 分 组 交换 机 的 
外 部 。 

© 分 组 交换 机 向 SDN 控制 器 发 送 
链 路 更 新 并 且 不 互相 发 送 。 

在 这 个 例子 中 ， 我 们 假设 交换 机 
sl 和 s2 之 间 的 链 路 断 开 ; 实现 了 最 短 
路 径路 由 选择 ， 因 此 ， 除 了 s2 操作 未 
改变 外 ，sl1 、s3 和 s4 的 人 和 出 流转 发 
规则 都 受到 影响 。 我 们 也 假定 Open- 
Flow 被 用 作 通 信 层 协议 ， 控 制 平 面 只 
执行 链 路 状态 路 由 选择 而 不 执行 其 他 
功能 。 

1) 交换 机 sl 经 历 了 自己 与 s2 之 间 
的 链 路 故障 ， 使 用 OpenFlow “端口 状 
态 ” 报 文 向 SDN 控制 器 通报 该 链 路 状 
态 的 更 新 。 

2) SDN 控制 器 接收 指示 链 路 状态 图 5-16 SDN 控制 器 场景 : 链 路 状态 更 新 
更 新 的 OpenFlow 报 文 ， 并 且 通 告 链 路 状态 管理 器 ， 由 管理 器 更 新 链 路 状态 库 。 

3) 实现 Dijkstra 链 路 状态 路 由 选择 的 网 络 控制 应 用 程序 先前 进行 了 注册 ， 当 链 路 状态 
更 新 时 将 得 到 通告 。 应 用 程序 接收 该 链 路 状态 更 新 的 通告 。 

4) 链 路 状态 路 由 选择 应 用 程序 与 链 路 状态 管理 器 相互 作用 ， 以 得 到 更 新 的 链 路 状态 ; 
它 也 会 参考 状态 管理 层 中 的 其 他 组 件 。 然 后 它 计算 新 的 最 低 开销 路 径 。 

5) 链 路 状态 路 由 选择 应 用 则 与 流 表 管理 器 交互 ， 流 表 管 理 器 决定 更 新 的 流 表 。 

6) REHA IEH OpenFlow 协议 更 新 位 于 受 影响 的 交换 机 sl1、s2 和 s4 的 流 表 项 ， 
其 中 sl 此 时 将 经 34 将 分 组 的 目的 地 指 回 s2, s2 此 时 将 经 中 间 交 换 机 s4 开始 接收 来 自 sl 
的 分 组 ，s4 此 时 必须 转发 来 目 sl 且 目 的 地 为 s2 的 分 组 。 

这 个 例子 虽 简单 ， 但 图 示 了 SDN 控制 平面 如 何 提供 控制 平面 服务 (此 时 为 网 络 层 路 
由 选择 ) ， 而 该 服务 以 前 是 以 每 路 由 需 控 制 在 每 台 路 由 器 中 实现 的 。 我 们 现在 能 够 容易 地 
体会 到 ，SDN 使 能 的 ISP 能 够 容易 地 将 最 低 开销 路 径 的 路 由 选择 转变 为 更 加 定制 的 路 由 选 
择 方法 。 因 为 控制 器 的 确 能 够 随心 所 欲 地 定制 流 表 ， 因 此 能 够 实现 它 喜 欢 的 任何 形式 的 转 
发 ， 即 只 是 通过 改变 它 的 应 用 控制 软件 。 这 种 改变 的 便利 性 与 传统 的 每 路 由 器 控制 平面 的 
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5.5.4 SDN 的 过 去 与 未 来 


尽管 对 SDN 的 强烈 兴趣 是 相对 近期 的 现象 ,但 SDN 的 技术 根源 ， 特 别 是 数据 平面 和 
控制 平面 的 分 离 ， 可 追溯 到 相当 和 久远。 在 2004 年 ， 文 献 [ Feamster 2004; Lakshman 2004; 
RFC 3746 | 中 都 赞成 网 络 数据 平面 与 控制 平面 分 离 。|[ van der Merwe 1998] 描述 了 用 于 具 
有 多 个 控制 器 的 ATM 网 络 [Black 1995] 的 控制 框架 ， 每 台 控 制 句 控制 若干 ATM 交换 机 。 
Ethane 项 目 开 拓 了 简单 基于 流 的 多 台 以 太 网 交换 机 和 一 台 集 中 式 控 制 器 的 网 络 概念 ， 其 中 
以 太 网 交换 机 具有 匹配 加 动作 流 表 ， 控 制 器 管理 流 准 入 和 路 由 选择 ， 而 未 匹配 的 分 组 将 从 
交换 机 转发 到 控制 器。 在 2007 年 ， 超 过 300 台 Ethane 交换 机 的 网 络 投入 运行 。Ethane it 
速 演 化 为 OpenFlow 项 目 ， 而 其 他 的 成 为 历史 ! 

很 多 研究 工作 以 研发 未 来 SDN 体系 结构 和 能 力 为 目标 。 如 我 们 所 见 ，SDN 革命 正在 
导致 颠覆 性 地 替代 专用 的 整体 交换 机 和 路 由 器 (它们 同时 具有 数据 平面 和 控制 平面 )。 类 
似 地 ， 称 之 为 网 络 功能 虚拟 化 (NFV) 的 通用 SDN 的 目标 是 用 简单 的 商用 服务 器 、 交 换 
机 和 存储 器 [ Gember-Jacobson 2014] 来 颠覆 性 地 替代 复杂 的 中 间 盒 (例如 用 于 媒体 高 速 
缓存 /服务 的 具有 专用 硬件 和 专 有 软件 的 中 间 盒 ) 。 第 二 个 重要 研究 领域 是 寻求 将 SDN 概 
GM AS 内 部 设置 扩展 到 AS 之 间 设 置 [Gupta 2014 ] 。 


SDN 控制 器 学 习 案例 : OpenDaylight 和 ONOS 控制 器 


在 SDN 发 展 早期 采用 单一 的 SDN 协议 (OpenFlow [ McKeown 2008; OpenFlow 
2009 ] ) 和 单一 的 SDN 控制 器 (NOX [Gude 2008] ) 。 此 后 ， 尤 其 是 SDN 控制 器 的 数量 有 | 
了 很 大 增长 [Kreutz 2015], #2 SDN 控制 器 是 公司 特有 的 和 专用 的 ,例如 ONIX [Kopo- | 
nen 2010 ] 、 隐 博 网 络 的 Contrail [ Juniper Contrail 2016] 以 及 谷歌 用 于 其 BA 广域网 的 控制 
器 [Jain 2013 ] 。 而 更 多 控制 器 是 开源 的 并 以 各 种 各 样 的 编程 语言 实现 [Erickson 2013]。 
最 近 ，OpenDaylight 控制 器 [ OpenDaylight Lithium 2016] 和 ONOS 控制 器 [ONOS 2016 | 
在 产业 界 得 到 广泛 支持 。 它 们 都 是 开源 的 ， 并 且 是 与 Linux 基金 会 合作 开发 的 。 | 

OpenDaylight 控制 器 

图 5-17 呈现 了 OpenDaylight Lithium SDN 控制 器 平台 的 简化 视图 [ OpenDaylight 
Lithium 2016], ODL 控制 器 组 件 的 主要 部 分 与 我 们 在 图 $-15 中 给 出 的 那些 组 件 严格 
对 应 。 网 络 服务 应 用 程序 用 于 决定 数据 平面 转发 和 其 他 服务 (如 防火 墙 和 负载 均衡 ) | 
| 如 何在 受 控 交换 机 中 完成 。 与 图 5-15 中 规范 的 控制 器 不 同 ，ODL 控制 器 具有 两 个 接 | 

口 ， 通 过 这 两 个 接口 ， 应 用 程序 可 以 与 原生 的 控制 器 服务 通信 以 及 彼此 之 间 相 互通 
信 : 外 部 应 用 程序 使 用 REST 请 求 -响应 API 与 控制 器 模块 通信 ， 通 信 运 行 在 HITP | 
上 。 内 部 应 用 程序 经 过 服务 抽象 层 (SAL) 互相 通信 。 至 于 控制 器 应 用 程序 是 在 外 部 
还 是 内 部 实现 ， 这 是 由 应 用 程序 设计 者 选择 决定 的 ， 图 5-17 中 显示 的 特定 应 用 程序 
配置 只 是 作为 一 个 例子 。 | 
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图 5-17 OpenDaylight 4 til #8 


ODL 的 基本 网 络 服务 功能 是 该 控制 器 的 核心 ， 它 们 密切 对 应 于 我 们 在 图 $-15 PH 
到 的 网 络 范围 状态 管理 能 力 。SAL 是 控制 器 的 神经 中 枢 ， 允 许 控 制 器 组 件 和 应 用 程序 互 
相 调用 服务 并 且 订 阅 它们 产生 的 事件 。 它 也 在 通信 层次 对 特定 的 底层 通信 协议 提供 了 统 
一 的 抽象 接口 ， 包 括 OpenFlow 和 SNMP (简单 网 络 管理 协议 ， 即 我 们 将 在 5.7 节 中 涉及 
的 一 种 网 络 管理 协议 ) OVSDB 是 用 于 管理 数据 中 心 交换 的 协议 ,而 数据 中 心 交换 是 
SDN 技术 的 一 个 重要 应 用 领域 。 我 们 将 在 第 6 章 中 介绍 数据 中 心 网 络 。 


网 络 控制 应 用 程序 


ONOS 分 布 式 核 


ETA ET Te Br 
Ce 


南 向 抽象 ， 协 议 





图 5-18 ONOS 控制 器 体系 结构 
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ONOS 控制 器 

图 5-18 呈现 了 ONOS 控制 器 的 简化 视图 [ONOS 2016 ] 。 类 似 于 图 5-15 中 的 规范 控 
制 器 ， 在 ONOS 控制 器 中 有 三 个 层次 : 

e 北向 抽象 和 协议 。ONOS 的 一 个 独 有 特征 是 它 的 意图 框架 ， 它 允许 应 用 程序 请 求 

高 层 服务 (例如 ， 在 主机 A 和 主机 B 之 间 建 立 一 条 连接 ， 或 相反 地 不 允许 主机 | 

A 和 主机 B 通信 )， 而 不 必 知 道 该 服务 的 执行 细节 。 或 者 以 同步 的 方式 (经 过 请 

求 ) ， 或 者 以 异步 的 方式 (经 过 监听 程序 回调 ， 例 如 等 网 络 状 态 改变 时 ) ， 经 过 

北向 API 向 网 络 控制 的 应 用 程序 提供 状态 信息 。 | 

e 分 布 式 核 。ONOS 的 分 布 式 核 中 维护 了 网 络 的 链 路 、 主 机 和 设备 的 状态 。ONOS 

被 部 署 为 在 一 系列 互联 的 服务 器 上 的 一 种 服务 ， 每 台 服 务 器 运行 着 ONOS 软件 的 

相同 副本 ， 增 加 服务 器 数量 就 提升 了 服务 能 力 。ONOS 核 提供 了 在 实例 之 间 服 务 

复制 和 协同 的 机 制 ， 这 种 机 制 为 上 层 应 用 程序 和 下 层 网 络 设备 提供 了 远 辑 上 集中 | 

的 核 服务 抽象 。 | 

南 向 抽象 和 协议 。 南 向 抽象 屏蔽 了 底层 主机 、 链 路 、 交 换 机 和 协议 的 异 构 性 ， 克 | 

许 分 布 式 核对 设备 和 协议 不 可 知 。 因 为 这 种 抽象 ， 位 于 分 布 式 核 下 方 的 南 向 接口 

还 辑 上 比 图 5$-14 中 的 规范 控制 器 或 图 5-17 中 的 ODL 控制 器 更 高 。 





5.6 ICMP: 因特网 控制 报 文 协议 


由 [RFC 792) 定义 的 因特网 控制 报 文 协议 (ICMP) ， 被 主机 和 路 由 器 用 来 彼此 沟通 
网 络 层 的 信息 。ICMP 最 典型 的 用 途 是 差错 报告 。 例 如 ， 当 运行 一 个 HTTP 会 话 时 ， 你 也 
许 会 遇 到 一 些 诸如 “目的 网 络 不 可 达 ” 之 类 的 错误 报 文 。 这 种 报 文 就 来 源 于 ICMP, EH 
个 位 置 ，IP 路 由 器 不 能 找到 一 条 通 往 HTTP 请 求 中 所 指定 的 主机 的 路 径 ， 该 路 由 器 就 会 向 
你 的 主机 生成 并 发 出 一 个 ICMP 报 文 以 指示 该 错误 。 

ICMP 通常 被 认为 是 IP 的 一 部 分 , 但 从 体系 结构 上 讲 它 位 于 IP 之 上 ， 因 为 ICMP 报 文 
是 承载 在 卫 分 组 中 的 。 这 就 是 说 ，ICMP 报 文 是 作为 卫 有 效 载荷 承载 的 ， 就 像 TCP 与 
UDP 报 文 段 作为 P 有 效 载荷 被 承载 那样 。 类 似 地 ， 当 一 台 主 机 收 到 一 个 指明 上 层 协议 为 
ICMP 的 IP 数据 报时 (上 层 协议 编码 为 1) ， 它 分 解 出 该 数据 报 的 内 容 给 ICMP， 就 像 分 解 
出 一 个 数据 报 的 内 容 给 TCP 或 UDP 一 样 。 

ICMP 报 文 有 一 个 类 型 字段 和 一 个 编码 字段 ， 并 且 包 含 引起 该 ICMP 报 文 首 次 生成 的 
IP 数据 报 的 首部 和 前 8 个 字 节 (以 便 发 送 方 能 确定 引发 该 差错 的 数据 报 )。 在 图 5-19 中 显 
示 了 所 选 的 ICMP 报 文 类 型 。 注 意 到 ICMP 报 文 并 不 仅 是 用 于 通知 差错 情况 。 

众所周知 的 ping 程序 发 送 一 个 ICMP 类 型 8 编码 0 的 报 文 到 指定 主机 。 看 到 回 显 
(echo) 请 求 ， 目 的 主机 发 回 一 个 类 型 0 编码 0 的 ICMP 回 显 回答 。 大 多 数 TCP/IP 实现 直 
接 在 操作 系统 中 支持 ping 服务 器 ， 即 该 服务 器 不 是 一 个 进程 。[ Stevens 1990] 的 第 11 章 
提供 了 有 关 ping 客户 程序 的 源码 。 注 意 到 客户 程序 需要 能 够 指示 操作 系统 产生 一 个 类 型 8 
编码 0 的 ICMP 报 文 。 

另 一 个 有 趣 的 ICMP 报 文 是 源 抑制 报 文 。 这 种 报 文 在 实践 中 很 少 使 用 。 其 最 初 目的 是 
执行 拥塞 控制 ， 即 使 得 拥塞 的 路 由 器 向 一 台 主 机 发 送 一 个 ICMP 源 抑制 报 文 ， 以 强制 该 主 
机 减 小 其 发 送 速率 。 我 们 在 第 3 章 已 看 到 ，TCP 在 运输 层 有 自己 的 拥塞 控制 机 制 ， 不 需要 
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利用 网 络 层 中 的 反馈 信息 ， 如 ICMP 源 抑制 报 文 。 





图 $-19 ICMP 报 文 类 型 


在 第 1 章 中 我 们 介绍 了 Traceroute 程序 ， 该 程序 允许 我 们 跟踪 从 一 台 主 机 到 世界 上 
任意 一 台 主 机 之 间 的 路 由 。 有 趣 的 是 ，Traceroute 是 用 ICMP 报 文 来 实现 的 。 为 了 判断 源 
和 目的 地 之 间 所 有 路 由 峰 的 名 字 和 地 址 ， 源 主机 中 的 Traceroute 回 目 的 地 主机 发 送 一 系 
列 普通 的 IP 数据 报 。 这 些 数据 报 的 每 个 携带 了 一 个 具有 不 可 达 UDP 端口 号 的 UDP 报 文 
段 。 第 一 个 数据 报 的 TIL 为 1， 第 二 个 的 TIL 为 2, 第 三 个 的 TIL 为 3， 依 次 类 推 。 该 
源 主机 也 为 每 个 数据 报 启动 定时 器 。 当 第 n 个 数据 报到 达 第 n 台 路 由 器 时 ,第 n 台 路 由 
静观 察 到 这 个 数据 报 的 TTL 正好 过 期 。 根 据 IP 协议 规则 ， 路 由 器 丢弃 该 数据 报 并 发 送 
一 个 ICMP 告警 报 文 给 源 主机 (类 型 11 编码 0) 。 该 告警 报 文 包含 了 路 由 器 的 名 字 和 它 
的 IP 地址 。 当 该 ICMP 报 文 返 回 源 主机 时 ， 源 主机 从 定时 器 得 到 往返 时 延 ， 从 ICMP FR 
文中 得 到 第 n 台 路 由 器 的 名 字 与 卫 地 址 。 

Traceroute 源 主机 是 怎样 知道 何 时 停止 发 送 UDP 报 文 段 的 呢 ? 前 面 讲 过 源 主机 为 它 发 
送 的 每 个 报 文 段 的 TTL 字段 加 1。 因此 ， 这 些 数据 报 之 一 将 最 终 沿 着 这 条 路 到 达 目 的 主 
机 。 因 为 该 数据 报 包 含 了 一 个 具有 不 可 达 端 口号 的 UDP 报 文 段 ， 该 目的 主机 将 向 源 发 送 
一 个 端口 不 可 达 的 ICMP 报 文 (类 型 3 编码 3) 。 当 源 主 机 收 到 这 个 特别 的 ICMP 报 文 时 ， 
知道 它 不 需要 再 发 送 另 外 的 探测 分 组 。( 标 准 的 Traceroute 程序 实际 上 用 相同 的 TTL 发 送 3 
个 一 组 的 分 组 ， 因 此 Traceroute 输出 对 每 个 TTL 提供 了 3 个 结果 。) 

以 这 种 方式 ， 源 主机 知道 了 位 于 它 与 目的 主机 之 间 的 路 由 器 数量 和 标识 ， 以 及 两 台 主 
机 之 间 的 往返 时 延 。 注 意 到 Traceroute 客户 程序 必须 能 够 指令 操作 系统 产生 具有 特定 TTL 
值 的 UDP 数据 报 ， 当 ICMP 报 文 到 达 时 ， 也 必须 能 够 由 它 的 操作 系统 进行 通知 。 既 然 你 已 
明白 了 Traceroute 的 工作 原理 ， 你 也 许 想 返 回去 更 多 地 使 用 它 。 

在 RFC 4443 中 为 IPv6 定义 了 ICMP 的 新 版 本 。 除 了 重新 组 织 现 有 的 ICMP 类 型 和 编码 
定义 外 ，ICMPv6 还 增加 了 新 型 IPv6 功能 所 需 的 新 类 型 和 编码 。 这 些 包括 “分 组 太 大 ”类 
型 和 一 个 “未 被 承认 的 IPv6 选项 ”差错 编码 。 
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5.7 网 络 管理 和 SNMP 


此 时 我 们 的 网 络 层 学 习 已 经 走 到 了 结尾 ， 我 们 前 面 仅 有 链 路 层 了 ， 我 们 都 熟知 网 络 是 由 
许多 复杂 、 交 互 的 硬件 和 软件 部 件 组 成 的 ， 既 包括 构成 网 络 的 物理 部 件 的 链 路 、 交 换 机 、 路 
由 器 、 主 机 和 其 他 设备 ， 也 包括 控制 和 协调 这 些 设 备 的 许多 协议 。 当 一 个 机 构 将 数 以 百 计 或 
数 以 千 计 的 这 种 部 件 拼装 在 一 起 形成 一 个 网 络 时 ， 保 持 该 网 络 “运行 良 好 ”对 网 络 管理 员 无 
疑 是 一 种 挑战 。 我 们 在 5.5 节 中 看 到 ，SDN 环境 中 逻辑 上 集中 的 控制 器 能 够 有 助 于 这 种 过 
程 。 但 是 网 络 管理 的 挑战 在 SDN 出 现 前 很 久 就 已 如 影 相 随 了 ， 网 络 管理 员 使 用 丰富 的 网 络 管 
理工 具 和 方法 来 监视 、 管 理 和 控制 该 网 络 。 在 本 节 中 我 们 将 学 习 这 些 工具 和 技术 。 

一 个 经 常 被 问 到 的 问题 是 : 什么 是 网 络 管理 ? 我 们 用 一 个 构思 续 密 的 单 铅 〈 虽 然 它 相 
HTK) 来 概括 网 络 管理 的 定义 [Saydam 1996 | ; 

“网 络 管理 包括 了 硬件 、 软 件 和 人 类 元 素 的 设置 、 综 合 和 协调 ， 以 监视 、 测 

试 、 轮 询 、 配 置 、 分 析 、 评 价 和 控制 网 络 及 网 元 资源 ， 用 合理 的 成 本 满足 实时 

性 、 运 营 性 能 和 服务 质量 的 要 求 。” 

给 定 了 这 个 宽泛 的 定义 ， 本 节 我 们 将 仅 涉 及 网 络 管理 的 入 门 知 识 ， 即 网 络 管理 员 在 执 
行 其 任务 中 所 使 用 的 体系 结构 、 协 议和 信息 库 。 我 们 将 不 涉及 网 络 管理 员 的 决策 过 程 ， 其 
中 故障 标识 [ Labovitz 1997; Steinder 2002; Feamster 2005; Wu 2005; Teixeira 2006 ] 、 昼 
常 检 测 [ Lakhina 2005; Barford 2009 | 、 满 足 约定 的 服务 等 级 约定 (Service Level Agree- 
ments，SLA) 的 网 络 设计 /工程 [Huston 1999a] 等 主题 会 加 以 考虑 。 因 此 我 们 有 意识 地 
收 罕 关 注 点 ， 有 兴趣 的 读者 应 当 参 考 这 些 文献 : 由 Subramanian 撰写 的 优秀 的 网 络 管理 教 
PHE [Subramanian 2000], ， 以 及 本 书 Web 网 站 上 可 用 的 详尽 的 网 络 管理 材料 。 


5.7.1 网 络 管理 框架 
图 5-20 显 式 了 网 络 管理 的 关键 组 件 。 





图 例 : 
> SNMP 协 议 


图 5-20 网络 管理 的 组 件 : 管理 服务 器 ， 被 管 设 备 ，MIB 数据 ， 远 程 代理 ，SNMP 
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。 管理 服务 器 (managing server) 是 一 个 应 用 程序 ， 通常 有 人 的 参与 ， 并 运行 在 网 络 
运营 中 心 (NOC) 的 集中 式 网 络 管理 工作 站 上 。 管 理 服务 器 是 执行 网 络 管理 活动 的 
地 方 ， 它 控制 网 络 管理 信息 的 收集 、 处 理 、 分 析 和 /或 显示 。 正 是 在 这 里 ， 发 起 控 
制 网 络 行为 的 动作 ， 人 类 网 络 管理 员 与 网 络 设 备 打 交道 。 

被 管 设 备 (managed device) 是 网 络 装备 的 一 部 分 〈 包 括 它 的 软件 ) ， 位 于 被 管理 的 
网 络 中 。 被 管 设 备 可 以 是 一 台 主 机 、 路 由 需 、 交 换 机 、 中 间 盒 、 调 制 解 调 硕 、 温 度 
计 或 其 他 联网 的 设备 。 在 一 个 被 管 设 备 中 ， 有 几 个 所 谓 被 管 对 象 (managed ob- 
ject) 。 这 些 被 管 对 象 是 被 管 设 备 中 硬件 的 实际 部 分 〈 例 如 ， 一 块 网 络 接口 卡 只 是 一 
台 主 机 或 路 由 需 的 一 个 组 件 ) 和 用 于 这 些 人 硬件 及 软件 组 件 的 配置 参数 (例如 ， 像 
OSPF 这 样 的 AS 内 部 路 由 选择 协议 ) 。 

一 个 被 管 设备 中 的 每 个 被 管 对 象 的 关联 信息 收集 在 管理 信息 库 (Management Infor- 
mation Base, MIB) 中 ,我们 将 看 到 这 些 信息 的 值 可 供 管理 服务 如 所 用 (并且 在 许 
多 场合 下 能 够 被 设置 )。 一 个 MIB 对 象 可 以 是 : 一 个 计数 器 ， 例 如 由 于 下 数据 报 首 
部 差错 而 由 路 由 带 丢 弃 的 IP 数据 报 的 数量 ,或 一 台 主 机 接收 到 的 UDP 报 文 段 的 数 
量 ; 运行 在 一 台 DNS 服务 器 上 的 软件 版 本 的 描述 性 信息 ; 诸如 一 个 特定 设备 功能 
是 否 正确 的 状态 信息 ; 或 诸如 到 一 个 目的 地 的 路 由 选择 路 径 的 特定 协议 的 信息 。 
MIB 对 象 由 称 为 SMI (Structure of Management Information) [ RFC 2578; RFC 2579; 
RFC 2580] 的 数据 描述 语言 所 定义 。 使 用 形式 化 定义 语言 可 以 确保 网 络 管理 数据 的 
语法 和 语义 是 定义 恨 好 的 和 无 二 义 性 的 。 相 关 的 MIB 对 象 被 收集 在 MIB 模块 
(module) 中 。 到 2015 年 年 中 ，RFC 定义 了 大 约 400 个 MIB 模块 ， 还 有 大 量 厂商 特 
定 的 (专用 的 ) MIB 模块 。 

在 每 个 被 管 设备 中 还 驻 留 有 网 络 管理 代理 (network management agent) ， 它 是 运行 
在 被 管 设备 中 的 一 个 进程 ， 该 进程 与 管理 服务 器 通信 ， 在 管理 服务 器 的 命令 和 控制 
下 在 被 管 设 备 中 采取 本 地 动作 。 网 络 管理 代理 类 似 于 我 们 在 图 5-2 中 看 到 的 路 由 选 
择 代理 。 

网 络 管理 框架 的 最 后 组 件 是 网 络 管理 协议 (network management protocol ) 。 该 协议 
运行 在 管理 服务 融和 被 管 设备 之 间 ， 人 允许 管理 服务 器 查 询 被 管 设备 的 状态 ， 并 经 过 
其 代理 间接 地 在 这 些 设 备 上 采取 行动 。 代 理 能 够 使 用 网 络 管理 协议 向 管理 服务 器 通 
知 异 常事 件 〈 如 组 件 故障 或 超过 了 性 能 国 值 ) 。 重 要 的 是 注意 到 网 络 管理 协议 自己 
不 能 管理 网 络 。 恰 恰 相 反 ， 它 为 网 络 管理 员 提 供 了 一 种 能 力 ， 使 他 们 能 够 管理 
(“ 监 视 、 测 试 、 轮 询 、 配 置 、 分 析 、 评 价 和 控制 ”) 网 络 。 这 是 一 种 细微 但 却 重要 
的 区 别 。 在 下 节 中 ， 我 们 将 讨论 因特网 的 SNMP 协议 。 


5.7.2 简单 网 络 管理 协议 


简单 网 络 管理 协议 (Simple Network Management Protocol) 版 本 2 (SNMPv2) [RFC 
3416] 是 一 个 应 用 层 协 议 ， 用 于 在 管理 服务 器 和 代表 管理 服务 器 执行 的 代理 之 间 传 递 网 络 
管理 控制 和 信息 报 文 。SNMP 最 第 使 用 的 是 请 求 响应 模式 ， 其 中 SNMP 管理 服务 器 向 
SNMP 代理 发 送 一 个 请 求 ， 代 理 接 收 到 该 请 求 后 ， 执 行 某 些 动作 ， 然 后 对 该 请 求 发 送 一 个 
回答 。 请 求 通常 用 于 查询 (检索) 或 修改 (设置 ) 与 某 被 管 设 备 关 联 的 MIB 对 象 值 。 
SNMP 第 二 个 和 常 被 使 用 的 是 代理 向 管理 服务 器 发 送 的 一 种 非 请 求 报 文 ， 该 报 文 称 为 陷阱 报 
X (trap message) 。 陷 阱 报 文 用 于 通知 管理 服务 器 ， 一 个 异常 情况 〈 例 如 一 个 链 路 接口 局 
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动 或 关闭 ) 已 经 导致 了 MIB 对 象 值 的 改变 。 
表 5-2 中 显示 了 SNMPv2 定义 的 7 种 类 型 的 报 文 ， 这 些 报 文 一 般 称 为 协议 数据 单元 
(PDU)。 图 5-21 显示 了 这 些 PDU 的 格式 。 


表 5-2 SNMPv2 PDU 类 型 


SNMPv2 PDU 类 型 发 送 方 -接收 方 描述 
GetRequest 管理 者 到 代理 取得 一 个 或 多 个 MIB 对 象 实例 值 
GetNextRequest 管理 者 到 代理 取得 列表 或 表格 中 下 一 个 MIB 对 象 实例 值 
GetBulkRequest 管理 者 到 代理 以 大 数据 块 方式 取得 值 ， 例 如 大 表 中 的 值 
InformRequest 管理 者 到 管理 者 向 不 能 访问 的 远程 管理 实体 通知 MIB 值 
SetRequest 管理 者 到 代理 设置 一 个 或 多 个 MIB 对 象 实例 的 值 
Response 代理 到 管理 者 或 管理 者 对 GetRequest, GetNextRequest, GetBulkRequest, SetRequest 
到 管理 者 PDU， 或 InformRequest 产生 的 响应 
SNMPv2 - Trap 代理 到 管理 者 向 管理 者 通知 一 个 异常 事件 
Get/Set 首 部 Get/Set 的 变量 
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SNMP PDU 
图 5-21 SNMP PDU 格式 


GetRequest , GetNextRequest 和 GetBulkRequest PDU 都 是 管理 服务 堪 加 代理 发 送 的 ， 
以 请 求 位 于 该 代理 所 在 的 被 管 设 备 中 的 一 个 或 多 个 MIB 对 象 值 。 其 值 被 请 求 的 MIB 
对 象 的 对 象 标识 符 定 义 在 该 PDU 的 变量 绑 定 部 分 。GetRequest、GetNextRequest 和 
GetBulkRequest 的 差异 在 于 它们 的 数据 请 求 粒度 。GetRequest 能 够 请 求 MIB 值 的 任 
BEA; 多 个 GetNextRequest 能 用 于 顺序 地 读 取 MIB 对 象 的 列表 或 表格 ; Get- 
BulkRequest 允许 读 取 大 块 数据 ， 能 够 避免 因 发 送 多 个 GetRequest 或 CetNextRequest 
报 文 可 能 导致 的 额外 开销 。 在 所 有 这 三 种 情况 下 ， 代 理 用 包括 该 对 象 标 识 符 和 它们 
相关 值 的 Response PDU 进行 响应 。 

管理 服务 器 使 用 SetRequest PDU 来 设置 位 于 被 管 设备 中 的 一 个 或 多 个 MIB 对 象 的 
值 。 代 理 用 带 有 “noError” 差错 状态 的 Response PDU 进行 应 答 ， 以 证 实 该 值 的 确 
已 被 设置 。 

管理 服务 器 使 用 InformRequest PDU 来 通知 男 一 个 MIB 信息 管理 服务 器 ， 后 者 对 于 
接收 服务 器 是 远程 的 。 

Response PDU 通常 从 被 管 设备 发 送 给 管理 服务 器 ， 以 啊 应 来 自 该 服务 器 的 请 求 报 
文 ， 返 回 所 请 求 的 信息 。 
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e SNMPv2 PDU 的 最 后 一 种 类 型 是 陷阱 报 文 。 陷 阱 报 文 是 异步 产生 的 ， 即 它们 不 是 为 
了 响应 接收 到 的 请 求 而 产生 的 ， 而 是 为 了 响应 管理 服务 器 要 求 通 知 的 事件 而 产生 
的 。RFC 3418 定义 了 周知 的 陷阱 类 型 ， 其 中 包括 设备 的 冷 启 动 或 热 局 动 、 链 路 就 
绪 或 故障 、 找 不 到 相 邻 设备 ， 或 鉴别 失效 事件 。 接 收 到 的 陷阱 请 求 不 要 求 从 管理 服 
务 器 得 到 响应 。 

考虑 到 SNMPv2 请 求 响应 性 质 ， 这 时 需要 注意 到 尽管 SNMP PDU 能 够 通过 许多 不 同 的 
运输 协议 传输 ， 但 SNMP PDU 通常 是 作为 UDP 数据 报 的 载荷 进行 传输 的 。RFC 3417 的 确 
表明 UDP 是 “首选 的 运输 上 映射"。 然 而 ， 由 于 UDP 是 一 种 不 可 靠 的 运输 协议 ， 因 而 不 能 
确保 一 个 请 求 或 它 的 响应 能 够 被 它 希 望 的 目的 地 接收 到 。 管 理 服务 器 用 该 PDU 的 请 求 ID 
字段 为 它 向 代理 发 送 的 请 求 编 号 ; 该 代理 的 响应 从 接收 到 的 请 求 中 获取 它 的 请 求 ID. AA 
此 ， 该 请 求 ID 字段 能 被 管理 服务 器 用 来 检测 丢失 的 请 求 或 回答 。 如 果 在 一 定时 间 后 还 没 
有 收 到 对 应 的 响应 ， 由 管理 服务 器 来 决定 是 否 重 传 一 个 请 求 。 特 别 是 ，SNMP 标准 没有 强 
制 任 何 特 殊 的 重 传 过 程 ， 即 使 初始 进行 重 传 。 它 只 是 要 求 管理 服务 器 “需要 根据 重 传 的 频 
率 和 周期 做 出 负责 任 的 动作 ”。 当 然 ,， 这 使 人 想 知 道 一 个 “负责 任 的 ”协议 应 当 如 何 
动作 ! 

SNMP 经 历 了 3 个 版 本 的 演变 。SNMPv3 的 设计 者 说 过 “SNMPv3 能 被 认为 是 具有 附加 
安全 性 和 管理 能 力 的 SNMPv2” [RFC 3410 ]。SNMPv3 无 疑 在 SNMPv2 基础 上 有 改变 ， 而 
没有 什么 比 在 管理 和 安全 领域 的 变化 更 为 明显 。 在 SNMPv3 中 ， 安 全 性 的 中 心地 位 特别 重 
要 ， 因 为 缺乏 适当 的 安全 性 导致 SNMP 主要 用 于 监视 而 不 是 控制 ( 例如， 在 SNMPvl 中 很 
少 使 用 SetRequest) 。 我 们 再 一 次 看 到 安全 性 是 重要 的 关注 点 (安全 性 是 第 8 章 详细 学 习 的 
主题 )， 尽 管 认识 到 它 的 重要 性 也 许 有 些 返 了 , 但 “亡羊补牢 ， 犹 未 为 晚 ”。 


5.8 人 小结 


我 们 现在 已 经 完成 了 进入 网 络 核心 的 两 章 旅 程 ， 即 开始 于 第 4 章 的 网 络 层 数据 平面 的 
学 习 和 本 章 完成 的 网 络 层 控制 平面 的 学 习 。 我 们 知道 了 控制 平面 是 网 络 范围 的 逻辑 ， 它 不 
仅 控制 从 源 主机 到 目的 主机 沿 着 端 到 端 路 径 在 路 由 器 之 间 如 何 转 发 数据 报 ， 而 且 控 制 网 络 
层 组 件 和 服务 器 如 何 配置 和 管理 。 

我 们 学 习 了 构建 控制 平面 有 两 大 类 方法 : 传统 的 每 路 由 器 控制 (其 中 在 每 台 路 由 器 中 
运行 算法 ， 并 且 路 由 器 中 的 路 由 选择 组 件 与 其 他 路 由 器 中 的 路 由 选择 组 件 通信 ) 和 软件 定 
义 网 络 (SDN) 控制 (其 中 一 个 逻辑 上 集中 的 控制 器 计算 并 向 每 台 路 由 融 分 发 转发 表 为 它 
们 所 用 ) 。 我 们 在 5.2 节 中 学 习 了 两 种 基本 的 路 由 选择 算法 ， 即 链 路 状态 和 距离 矢量 ,用 
于 计算 图 中 的 最 小 开销 路 径 ; 这 些 算法 在 每 路 由 器 控制 和 SDN 控制 中 都 有 应 用 。 这 些 算 
法 是 两 种 广泛 部 署 的 因特网 路 由 选择 协议 OSPF 和 BGP 的 基础 ， 我 们 在 5.3 节 和 5.4 节 中 
讨论 了 这 两 种 协议 。 我 们 在 5. 5 节 中 讨论 了 网 络 层 控制 平面 的 SDN 方法 ,研究 了 SDN 网 
络 控 制 应 用 程序 、SDN 控制 器 ， 以 及 控制 器 和 SDN 控制 设备 之 间 通 信 所 使 用 的 OpenFlow 
协议 。 在 5.6 节 和 5.7 节 中 ， 我们 包括 了 管理 IP 网 络 的 某 些 技术 细节 : ICMP (互联 网 控 
制 报 文 协议 ) 和 SNMP (简单 网 络 管理 协议 ) 。 

在 完成 了 网 络 层 学 习 之 后 ， 我 们 的 旅行 此 时 沿 着 协议 栈 向 下 走 了 一 步 ， 即 到 了 链 路 
层 。 像 网 络 层 一 样 ， 链 路 层 是 每 台 网 络 连接 的 设备 的 一 部 分 。 但 我 们 将 在 下 一 章 中 看 到 ， 
链 路 层 的 任务 是 在 相同 链 路 或 局 域 网 之 间 更 局 域 化 地 移动 分 组 。 尽 管 这 种 任务 从 表面 上 看 
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可 能 比 网 络 层 任务 简单 得 多 ， 但 我 们 将 看 到 ， 链 路 层 涉及 许多 重要 和 引 人 人 和 人 胜 的 问题 ， 这 
些 问 题 会 花费 我 们 不 少时 间 。 


课 后 习题 和 问题 





5.1 节 
RI. 基于 每 路 由 器 控制 的 控制 平面 意味 着 什么 ?” 在 这 种 情况 下 ， 当 我 们 说 网 络 控制 平面 和 数据 平面 是 
“整体 地 ”实现 时 ， 是 什么 意思 ? 
R2. 基于 逻辑 上 集中 控制 的 控制 平面 意味 着 什么 ? 在 这 种 有 情况 下 ， 数 据 平 面 和 控制 平面 是 在 相同 的 设 
备 或 在 分 离 的 设备 中 实现 的 吗 ? 请 解释 。 
5.2 节 
R3. 比较 和 对 照 集 中 式 和 分 布 式 路 由 选择 算法 的 性 质 。 给 出 一 个 路 由 选择 协议 的 例子 ， 该 路 由 选择 协议 
采用 分 布 式 方 法 和 集中 式 方 法 。 
R4. 比较 和 对 照 链 路 状态 和 距离 矢量 这 两 种 路 由 选择 算法 。 
R5. 在 距离 矢量 路 由 选择 中 的 “无 穷 计数 ” 是 什么 意思 ? 
R6. 每 个 自治 系统 使 用 相同 的 AS 内 部 路 由 选择 算法 是 必要 的 吗 ? 说 明 其 原因 。 
5.3~5.4 节 
R7. 为 什么 在 因特网 中 用 到 了 不 同 的 AS 间 与 AS 内 部 协议 ? 
R8. 是 非 判断 题 : 当 一 台 OSPF 路 由 器 发 送 它 的 链 路 状态 信息 时 ， 它 仅 向 那些 直接 相 邻 的 节点 发 送 。 解 释 
理由 。 
R9. 在 OSPF 自治 系统 中 区 域 表 示 什 么 ? 为 什么 引入 区 域 的 概念 ? 
R10. 定义 和 对 比 下 列 术 语 : 子 网 、 前 级 和 BGP 路 由 。 
R11. BGP 是 怎样 使 用 NEXT- HOP 属性 的 ? 它 是 怎样 使 用 AS-PATH 属性 的 ? 
R12. 描述 一 个 较 高 层 ISP 的 网 络 管理 员 在 配置 BGP 时 是 如 何 实现 策略 的 。 
R13. 是 非 判 断 题 : 当 BCP 路 由 器 从 它 的 邻居 接收 到 一 条 通告 的 路 径 时 ， 它 必须 对 接收 路 径 增加 上 它 自 
己 的 标识 ， 然 后 向 其 所 有 邻居 发 送 该 新 路 径 。 解 释 理由 。 
5.54% 
R14. 描述 在 SDN 控制 器 中 的 通信 层 、 网 络 范围 状态 管理 层 和 网 络 控制 应 用 程序 层 的 主要 任务 。 
R15. 假定 你 要 在 SDN 控制 平面 中 实现 一 个 新 型 路 由 选择 协议 。 你 将 在 哪个 层次 中 实现 该 协议 ? 解释 
理由 。 
R16. 什么 类 型 的 报 文 流 跨越 SDN 控制 器 的 北向 和 南 向 API? 谁 是 从 控制 器 跨越 南 向 接口 发 送 的 这 些 报 文 
的 接收 者 ? 谁 是 跨越 北向 接口 从 控制 器 发 送 的 这 些 报 文 的 接收 者 ? 
R17. 描述 两 种 从 受 控 设备 到 控制 器 发 送 的 OpenFlow 报 文 (由 你 所 选 ) 类 型 的 目的 。 描 述 两 种 从 控制 器 
到 受 控 设备 发 送 的 OpenFlow 报 文 (由 你 所 选 ) 类 型 的 目的 。 
R18. 在 OpenDaylight SDN 控制 器 中 服务 抽象 层 的 目的 是 什么 ? 
5.6-5.7 $ 
R19. 列举 4 种 不 同类 型 的 ICMP 报 文 。 
R20. 在 发 送 主机 执行 Traceroute 程序 ， 收 到 哪 两 种 类 型 的 ICMP 报 文 ? 
R21. 在 SNMP 环境 中 定义 下 列 术 语 : 管理 服务 器 、 被 管 设备 、 网 络 管理 代理 和 MIB。 
R22. SNMP GetRequest 和 SetRequest 报 文 的 目的 是 什么 ? 
R23. SNMP 陷阱 报 文 的 目的 是 什么 ? 
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习题 


Pl. 观察 图 5-3， 列 举 从 y 到 不 包含 任何 环 路 的 路 径 。 

. 重复 习题 P1， 列 举 从 x 到 z、z 到 4 以 及 z 到 w 的 不 包含 任何 环 路 的 路 径 。 

. 考虑 下 面 的 网 络 。 对 于 标明 的 链 路 开销 ， 用 Dijkstra 的 最 短路 算法 计算 出 从 x 到 所 有 网 络 节点 的 最 短 
路 径 。 通 过 计算 一 个 类 似 于 表 5-1 OR, 说 明 该 算法 是 如 何 工作 的 。 


Os 





P4. 考虑 习题 P3 中 所 示 的 网 络 。 使 用 Dijkstra 算法 和 一 个 类 似 于 表 5-1 的 表 来 说 明 你 做 的 工作 : 
a 计算 出 从 :到 所 有 网 络 节点 的 最 短路 径 。 
b. 计算 出 从 4 到 所 有 网 络 节点 的 最 短路 径 。 

计算 出 从 v 到 所 有 网 络 节点 的 最 短路 径 。 

计算 出 从 w 到 所 有 网 络 节点 的 最 短路 径 。 

计算 出 从 y 到 所 有 网 络 节点 的 最 短路 径 。 

计算 出 从 z 到 所 有 网 络 节点 的 最 短路 径 。 

PS. 考虑 下 图 所 示 的 网 络 ， 假 设 每 个 节点 初始 时 知道 到 它 的 每 个 邻居 的 开销 。 考 虑 距离 向 量 算法 ， 并 显 
示 在 节点 z 中 的 距离 表 表 项 。 


moe 9 





P6. 考虑 一 个 一 般 性 拓扑 〈 即 不 是 以 上 所 显示 的 特定 网 络 ) 和 一 个 同步 版 本 的 距离 向 量 算法 。 假 设 每 次 
和 迭代 时 ， 一 个 节点 与 其 邻居 交换 其 距离 向 量 并 接收 它们 的 距离 向 量 。 假 定 算法 开始 时 ， 每 个 节点 只 
知道 到 其 直接 邻居 的 开销 ， 在 该 分 布 式 算法 收敛 前 所 需 的 最 大 迭代 次 数 是 多 少 ? 评估 你 的 答案 。 

P7. 考虑 下 图 所 示 的 网 络 段 。x 只 有 两 个 相连 邻居 w 与 y。w 有 一 条 通 向 目的 地 wu (没有 显示 ) 的 最 低 开 
销路 径 ， 其 值 为 5，y 有 一 条 通 疝 目的 地 4 的 最 低 开 销路 径 ， 其 值 为 6。 从 w 与 y 到 uw (以 及 w 与 y 之 
间 ) 的 完整 路 径 未 显示 出 来 。 网 络 中 所 有 链 路 开销 皆 为 正 整 数值 。 
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Piz. 
Fl3; 
P14. 


P15. 


b. 给 出 对 于 c(x, w) 或 c(x，7y) 的 链 路 开销 的 变化 ， 使 得 执行 了 距离 向 量 算法 后 ,x 将 通知 其 邻居 
有 一 条 通 向 4 的 新 最 低 开销 路 径 。 

c. 给 出 对 c(x, w) Roelx, y) 的 链 路 开销 的 变化 ， 使 得 执行 了 距离 向 量 算法 后 ，x 将 不 通知 其 邻居 
有 一 条 通 向 x 的 新 最 低 开 销路 径 。 


. 考虑 如 图 5-6 中 所 示 3 个 节点 的 拓扑 。 不 使 用 显示 在 图 5-6 中 的 开销 值 ， 链 路 开销 值 现在 是 cx，y) =3, c 


(y, z) =6，c(z，x) =4。 在 距离 向 量 表 初 始 化 后 和 在 同步 版 本 的 距离 向 量 算法 每 次 迭代 后 ， 计 算 它 
的 距离 向 量 表 (如 我 们 以 前 对 图 5-6 讨论 时 所 做 的 那样 ) 。 


. 考虑 距离 向 量 路 由 选择 中 的 无 穷 计 数 问题 。 如 果 我 们 减 小 一 条 链 路 的 开销 ， 将 会 出 现 无 穷 计 数 问题 


吗 ? 为 什么 ? 如 果 我 们 将 没有 链 路 的 两 个 节点 连接 起 来 ， 会 出现 什么 情况 ? 


. 讨论 图 5-6 中 的 距离 向 量 算法 ， 距 离 向 量 D(x) 中 的 每 个 值 不 是 递增 的 并 且 最 终 将 在 有 限 步 中 稳定 


下 来 。 


. 考虑 图 5-7。 假 定 有 男 一 台 路 由 器 w， 与 路 由 器 y 和 = 连接 。 所 有 链 路 的 开销 给 定 如 下 : c(x, y) = 


4, c(x, z) =50, c(y, w) =1, e(z, w) =1, e(y, z) =3。 假 设 在 距离 向 量 路 由 选择 算法 中 使 用 了 

毒性 逆转 。 

a. 当 距 离 向 量 路 由 选择 稳定 时 ， 路 由 器 w、y 和 z 向 x 通 知 它们 之 间 的 距离 。 它 们 告诉 彼此 什么 样 
的 距离 值 ? 

b. 现在 假设 x Al y 之 间 的 链 路 开销 增加 到 60。 如 果 使 用 了 毒性 逆转 ， 将 会 存在 无 穷 计数 问题 吗 ” 为 
什么 ?如 果 存 在 无 穷 计 数 问题 ， 距 离 向 量 路 由 选择 需要 多 少 次 迭代 才能 再 次 到 达 稳 定 状 态 ? 评估 
你 的 答案 。 

c. 如 果 c(y, x) 从 4 变化 到 60， 怎 样 修改 c(y，z) 使 得 不 存在 无 穷 计 数 问题 。 

描述 在 BGP 中 是 如 何 检测 路 径 中 的 环 路 的 。 

BGP 路 由 器 将 总 是 选择 具有 最 短 AS 路 径 长 度 的 无 环 路 由 吗 ? 评估 你 的 答案 。 

考虑 下 图 所 示 的 网 络 。 假 定 AS3 和 AS2 正在 运行 OSPF 作为 其 AS 内 部 路 由 选择 协议 。 假 定 ASI 和 

AS4 正在 运行 RIP 作为 其 AS 内 部 路 由 选择 协议 。 假 定 AS 间 路 由 选择 协议 使 用 的 是 eBGP 和 iBGP, 

假定 最 初 在 AS2 和 AS 之 间 不 存在 物理 链 路 。 

a. 路 由 器 3c 从 下 列 哪个 路 由 选择 协议 学 习 到 了 前 缀 x: OSPF. RIP, eBGP 或 iBGP? 

b. 路 由 器 3a 从 哪个 路 由 选择 协议 学 习 到 了 前 缀 x? 

c. 路 由 器 lc 从 哪个 路 由 选择 协议 学 习 到 了 前 级 x? 

d. 路 由 器 1d 从 哪个 路 由 选择 协议 学 习 到 了 前 组 x? 





参考 前 面 习题 P14, 一 旦 路 由 器 1d 知道 了 x 的 情况 ， 它 将 一 个 表 项 (x, 1) 放 人 它 的 转发 表 中 。 

a 对 这 个 表 项 而 言 ,1 将 等 于 1 还 是 1,? 用 一 句 话 解释 其 原因 。 

b. 现在 假定 在 AS2 和 ASM 之 间 有 一 条 物理 链 路 ， 显 示 为 图 中 的 虚线 。 假 定 路 由 器 1d 知道 经 AS2 以 
及 经 AS 能 够 访问 到 x。1 将 设置 为 1 还 是 L? 用 一 句 话 解释 其 原因 。 

c. 现在 假定 有 另 一 个 AS， 它 称 为 AS5 ， 其 位 于 路 径 AS2 MAM 之 间 (没有 显示 在 图 中 )。 假定 路 由 
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器 ld 知道 经 AS2 ASS AS4 以 及 经 过 AS3 AS4 能 够 访问 到 x。1 将 设置 为 /还 是 L? 用 一 句 话 解释 
其 原因 。 

P16. 考虑 下 面 的 网 络 。ISP B 为 地 区 ISP A 提供 国家 级 主干 服务 。ISP C 为 地 区 IS D 提供 国家 级 主干 服 
务 。 每 个 ISP 由 一 个 AS 组 成 。B 和 C 使 用 BGP， 在 两 个 地 方 互相 对 等 。 考 虑 从 A 到 DD 的 流量 。B 
愿意 将 流量 交 给 C 传 给 西海 岸 (使 得 C 将 承担 承载 跨越 整个 国家 的 流量 开销 )， 而 C 愿意 经 其 东海 
岸 与 B 对 等 的 站 点 得 到 这 些 流量 (使 得 B 将 承载 跨越 整个 国家 的 流量 )。C 可 能 会 使 用 什么 样 的 
BGP 机 制 ， 使 得 B 将 通过 东海 岸 对 等 点 传递 A 到 DD 的 流量 ? 要 回答 这 个 问题 ， 你 需要 钻研 BCP 
规范 。 





P17. 在 图 5-13 P, ZESAR W., XAY 的 路 径 信 息 。 基 于 WW 与 X 处 的 可 用 信息 ， 它 们 分 别 看 到 
的 网 络 拓扑 是 什么 ?评估 你 的 答案 。Y 所 见 的 拓扑 视图 如 下 图 所 示 。 
Wk. 


Pitas. 


C ， 桩 网 络 Y 所 见 拓 扑 视图 


P18. 考虑 图 5-13。B 将 不 会 基于 BCP 路 由 选择 ， 经 过 X 以 Y 为 目的 地 转发 流量 。 但 是 有 某 些 极为 流行 
的 应 用 程序 ， 其 数据 分 组 先 朝向 X， 然 后 再 流向 Y。 指 出 一 种 这 样 的 应 用 程序 ， 描 述 数据 分 组 是 如 
何 沿 着 这 条 未 由 BGP 路 由 选择 所 给 定 的 路 径流 动 的 。 

P19. 在 图 5-13 中 ， 假 定 有 另 一 个 桩 网 络 V， 它 为 ISP A 的 客户 。 假 设 B 和 (C 具有 对 等 关系 , 并 且 A 是 B 
AC 的 客户 。 假 设 A 希望 让 发 向 W 的 流量 仅 来 自 B， 并 且 发 向 V 的 流量 来 自 B 或 C。A 如 何 向 B 和 
C 通告 其 路 由 ? C 收 到 什么 样 的 AS 路 由 ? 

P20. 假定 AS X 和 2Z 不 直接 连接 ,但 与 ASY 连接 。 进 一 步 假定 X 与 Y 具 有 对 等 协定 ，Y 与 Z 具 有 对 等 协 
定 。 最 后 ， 假 定 Z 要 传送 所 有 Y 的 流量 但 不 传送 X 的 流量 。BCP 允许 Z 实现 这 种 策略 吗 ? 

P21. 考虑 在 管理 实体 和 被 管 设 备 之 间 发 生 通信 的 两 种 方式 : 请 求 响应 方式 和 陷阱 方式 。 从 以 下 方面 考虑 
这 两 种 方式 的 优 缺 点 : 开销 ; @ 当 异常 事件 出 现时 通知 的 时 间 ; @ 对 于 管理 实体 和 设备 之 间 丢 失 
报 文 的 健壮 性 。 

P22. 在 5.7 节 中 我 们 看 到 ， 用 不 可 靠 的 UDP 数据 报 传输 SNMP 报 文 是 更 可 取 的 方式 。 请 考虑 SNMP 设计 
者 选择 UDP 而 不 是 TCP 作为 SNMP 运输 协议 的 理由 。 


-| 套 接 字 编 程 作业 


一 一 -一 


在 第 2 章 结尾 给 出 了 4 个 套 接 字 编程 作业 。 下 面 给 出 第 5 个 应 用 ICMP 的 作业 (ICMP 的 是 本 章 讨 论 
的 协议 ) 。 

作业 5: ICMP ping 

ping 是 一 种 流行 的 网 络 应 用 程序 ， 用 于 测试 位 于 远程 的 某 个 特定 的 主机 是 否 开机 和 可 达 。 它 也 经 常 
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用 于 测量 客户 主机 和 目标 主机 之 间 的 时 延 。 它 的 工作 过 程 是 : 向 目标 主机 发 送 ICMP“ 回 显 请 求 ” 分 组 
( 即 ping 分 组 ) ， 并 且 侦 听 ICMP“ 回 显 啊 应 ”应 答 ( 即 pong 分 组 ) ping 测量 RRT、 记 录 分 组 丢失 和 计 
AA ping-pong 交换 (往返 时 间 的 最 小 、 平 均 、 最 大 和 标准 差 ) 的 统计 汇总 。 

在 本 实验 中 ， 读 者 将 用 Python 语言 编写 自己 的 ping 应 用 程序 。 该 应 用 程序 将 使 用 ICMP。 但 为 了 保 
持 程序 的 简单 ， 将 不 完全 遵循 RFC 1739 中 的 官方 规范 。 注 意 到 仅 需 要 写 该 程序 的 客户 程序 ， 因 为 服务 器 
侧 所 需 的 功能 构建 在 几乎 所 有 的 操作 系统 中 。 读 者 能 够 在 Web 站 点 http://www. pearsonhighered. com/cs- 
resources 找到 本 作业 的 全 面 细节 ， 以 及 该 Python 代码 的 重要 片段 。 


< 编程 作业 


一 一 一 一 


在 本 编程 作业 中 ， 需 要 写 一 组 “分 布 式 ”程序 ， 以 为 下 图 所 示 的 网 络 实现 一 个 分 布 式 异 步 距离 向 量 
路 由 选择 算法 。 





BD 


要 写 出 下 列 例 程 ， 这 些 例 程 将 在 为 该 作业 提供 的 模拟 环境 中 异步 “执行 "。 对 于 节点 0， 将 要 写 出 这 
样 的 例 程 : 

e rtinit0() 。 在 模拟 开始 将 调用 一 次 该 例 程 。rtinit0 () 无 参数 。 它 应 当初 始 化 节点 0 中 的 距离 表 ， 

以 反映 出 到 达 节 点 1、2 和 3 的 直接 开销 分 别 为 1!、3 和 7。 在 上 图 中 ， 所 有 链 路 都 是 双向 的 ， 两 
个 方向 的 开销 皆 相 同 。 在 初始 化 距离 表 和 节点 0 的 例 程 所 需 的 其 他 数据 结构 后 ， 它 应 向 其 直接 
连接 的 邻居 (在 本 情况 中 为 节点 1、2 和 3) 发 送 它 到 所 有 其 他 网 络 节点 的 最 低 开 销路 径 的 开销 
信息 。 通 过 调用 例 程 tolayer2() ， 这 种 最 低 开 销 信息 在 一 个 路 由 选择 更 新 分 组 中 被 发 送 给 相 邻 节 
点 ， 就 像 在 完整 编程 作业 中 描述 的 那样 。 路 由 选择 更 新 分 组 的 格式 也 在 完整 编程 作业 中 进行 
描述 。 

© rtupdate0( struct rtpkt * rcvdpkt) 。 当 节点 0 收 到 一 个 由 其 直接 相连 邻 届 之 一 发 给 它 的 路 由 选择 分 

组 时 ， 调 用 该 例 程 。 参 数 * rcvdpkt 是 一 个 指向 接收 分 组 的 指针 。rtupdate0() FE FB A [a] E HIE AY 
“核心 ”。 它 从 其 他 节点 i 接收 的 路 由 选择 更 新 分 组 中 包含 节点 i 到 所 有 其 他 网 络 节 点 的 当前 最 
短路 径 开销 值 。rtupdate0() 使 用 这 些 收 到 的 值 来 更 新 其 自身 的 距离 表 (这 是 由 距离 向 量 算法 所 
规定 的 ) 。 如 果 它 自己 到 另外 节点 的 最 低 开 销 由 于 此 更 新 而 发 生 改变 的 话 ， 则 节点 0 通过 发 送 一 
个 路 由 选择 分 组 来 通知 其 直接 相连 邻居 这 种 最 低 开 销 的 变化 。 我 们 在 距离 向 量 算法 中 讲 过 ， 仅 
有 直接 相连 的 节点 才 交 换 路 由 选择 分 组 。 因 此 ， 节 点 1 和 节点 2 将 相互 通信 ， 但 节点 1 和 节点 3 
将 不 相互 通信 。 

为 节点 1、2、3 定义 类 似 的 例 程 。 因 此 你 总 共 将 写 出 8 个 例 程 : rtinitO() 、rtinitl () 、rtinit2 ()、 
rtinit3() 、rtupdate0() 、rtupdatel () 、rtupdate2() 和 rtupdate3() 。 这 些 例 程 将 共同 实现 一 个 分 布 式 的 、 与 图 
中 所 示 拓 扑 和 开销 相关 的 距离 表 的 异步 计算 。 

读者 可 在 网 址 http://www. pearsonhighered. com/cs- resources 处 找到 该 编程 作业 的 全 部 详细 资料 ， 以 及 
创建 模拟 硬件 /软件 环境 所 需 的 C 程序 代码 。 一 个 Java 版 的 编程 作业 也 可 供 使 用 。 


é | Wireshark 实验 


在 本 书 配 套 的 Web 站 点 www. pearsonhighered. com/cs- resource 上 ， 将 找到 一 个 Wireshark 实验 作业 ， 
该 作业 考察 了 在 ping 和 traceroute 命令 中 ICMP 协议 的 使 用 。 
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E 人 物 专 访 


Jennifer Rexford 是 美国 普林斯顿 大 学 计算 机 科学 系 的 教授 。 她 的 研究 
有 宏大 的 目标 : 使 计算 机 网 络 更 容易 设计 和 管理 ， 特 别 强调 路 由 选择 协 
议 。1996 ~2004 年 ， 她 在 ATAT 实验 室 网 络 管理 和 性 能 部 工作 。 在 AT&T 
期 间 ， 她 设计 了 用 于 网 络 测量 、 流 量 工程 和 路 由 器 配置 的 技术 和 工具 ， 这 
些 技 术 和 工具 部 署 在 AT&T t FTA, Jennifer 是 《Web 协议 和 实践 ; 
网 络 协 议 、 高 速 缓 存 和 流量 测量 》 (Web Protocols and Practice; Networking 
Protocols, Caching, and Traffic Measurement) 一 书 的 合作 者 ， 该 书 由 Addi- 
son- Wesley 出 版 社 于 2001 年 5 月 出 版 。 她 在 2003 ~ 2007 年 担任 ACM SIG- 
COMM 主席 一 职 。 于 1991 年 从 普林斯顿 大 学 电气 工程 获得 学 士 学 位 ， 并 Jennifer Rexford 
于 1996 年 从 密 西 根 大 学 电气 工程 和 计算 机 科学 获得 博士 学 位 。 在 2004 年 ， 
Jennifer 赢得 了 ACM 的 计算 机 专业 杰出 青年 Grace Murray Hopper 奖 ， 并 入 列 35 岁 以 下 顶级 创新 
家 的 MIT TR-100 名 单 。 





。 请 描述 在 您 的 职业 生涯 中 干 过 的 一 两 个 最 令 人 激动 的 项 目 。 工 作 中 最 大 的 挑战 是 什么 ? 

当 我 是 AT&T 的 研究 员 时 ， 我 们 一 群 人 设计 了 一 种 管理 因特网 服务 提供 商 主干 网 络 路 由 的 新 方法 。 
传统 上 ， 网 络 操作 员 逐 个 配置 每 台 路 由 器 ， 并 且 这 些 路 由 器 运行 分 布 式 协议 以 计算 通过 该 网 络 的 路 径 。 
我 们 认为 如 果 网 络 操作 员 能 够 基于 网 络 范 围 拓 扑 和 流量 的 视图 直接 控制 路 由 器 如 何 转发 流量 ， 网 络 管理 
将 更 为 简单 和 灵活 。 我 们 设计 并 建造 的 路 由 控制 平台 (RCP) 能 够 在 一 台 商 用 计算 机 上 为 所 有 AT&T E 
广 计算 路 径 ， 并 且 能 够 不 加 修改 地 控制 老式 路 由 器 。 对 我 而 言 ， 这 个 项 目 是 令 人 兴奋 的 ， 因 为 我 们 有 一 
个 刺激 性 的 想法 、 一 个 工作 的 系统 以 及 最 终 在 一 个 运营 的 网 络 中 实际 部 署 。 快 速 向 前 走 了 几 年 ， 软 件 定 
义 网 络 (SDN) 已 经 成 为 一 种 主流 技术 ， 标 准 协议 (如 OpenFlow) 可 以 告诉 底层 的 交换 机 做 些 什么 更 为 
容易 。 

e 您 认为 软件 定义 网 络 未 来 应 当 如 何 演进 ? 

与 以 往 最 大 的 不 同 之 处 在 于 ， 控 制 平面 软件 能 够 由 许多 不 同 的 程序 员 创建 ， 而 不 只 是 由 销售 网 络 设 
备 的 公司 生成 。 同 时 不 像 在 服务 器 或 智能 手机 上 运行 的 应 用 程序 ， 控 制 器 应 用 程序 必须 在 一 起 工作 以 处 
理 相同 的 流量 。 网 络 操作 员 不 希望 对 某 些 流量 执行 负载 均衡 而 对 其 他 流量 进行 路 由 选择 ; 相反 ， 他 们 项 
望 在 相同 的 流量 上 执行 负载 均衡 和 路 由 选择 。 未 来 的 SDN 控制 器 平台 应 当 使 独立 编写 的 多 个 控制 器 应 用 
程序 在 一 起 合作 ， 提 供 良好 的 编程 抽象 。 更 一 般 地 ， 良 好 的 编程 抽象 能 够 使 得 生成 控制 器 应 用 程序 更 为 
容易 ， 而 不 必 担 心 诸如 流 表 项 、 流 量 计数 器 、 分 组 首部 的 比特 样式 等 底层 细节 。 此 外 ， 虽然 SDN 控制 器 
是 软 辑 上 集中 的 ,但 网 络 仍然 是 由 分 布 式 设备 集合 组 成 的 。 未 来 的 控制 器 应 当 为 跨 网 络 更 新 流 表 提 供 良 
好 抽象 ， 因 此 应 用 程序 能 够 在 设备 更 新 时 推断 出 传输 中 的 分 组 发 生 了 什么 情况 。 对 控制 平面 软件 的 编程 
抽象 是 一 个 令 人 兴奋 的 计算 机 网 络 、 分 布 式 系统 和 编程 语言 之 间 的 多 学 科研 究 领 域 ， 有望 在 未 来 几 年 产 
生 实 际 影响 。 

o 您 预见 网 络 和 因特网 的 未 来 往 何 处 发 展 ? 

网 络 是 一 个 令 人 兴奋 的 领域 ， 因 为 应 用 程序 和 底层 技术 无 时 不 在 变化 。 我 们 总 是 在 重 塑 自己 ! 甚至 
在 10 年 前 ， 有 谁 能 够 预测 到 智能 手机 的 一 统 天 下 ， 人 允许 移动 用 户 访问 现 有 应 用 程序 以 及 新 型 基于 位 置 的 
服务 呢 ? 云 计算 的 出 现 从 根本 上 改变 了 用 户 与 他 们 运行 的 应 用 程序 之 间 的 关系 ， 联 网 的 传感器 和 执行 器 
( 物 联 网 ) 使 得 大 量 的 新 应 用 ( 和 安全 脆弱 性 ) 成 为 可 能 ! 创新 的 步伐 真正 令 人 兴奋 不 已 。 

底层 网 络 是 所 有 这 些 创 新 中 的 要 素 。 固 然 ,， 该 网 络 声名 狼藉 地 “造成 不 便 ”: 限制 7 了 性能， 损害 了 
可 靠 性 ， 约 束 了 应 用 以 及 使 服务 的 部 署 和 管理 复杂 化 。 我 们 应 当 继 续 努 力 使 得 未 来 的 网 络 就 像 我们 呼吸 
的 空气 一 样 不 可 见 ， 因 此 网 络 决 不 会 成 为 新 思想 和 有 价值 服务 的 拦路 虎 。 为 此 ， 我们 需要 在 各 个 网 络 设 
备 和 协议 〈 以 及 它们 的 首 字 母 缩 略 词 ) 之 上 提升 抽象 等 级 ， 使 得 我 们 能 够 对 该 网 络 以 及 用 户 的 高 层 目标 
作为 一 个 整体 进行 推理 。 
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。 是 谁 激发 了 您 的 职业 灵感 ? 

我 在 国际 计算 机 科学 研究 所 长 期 受到 Sally Floyd 的 激励 。 她 的 研究 总 是 有 明确 目标 ， 聚焦 因特网 
面临 的 重要 挑战 。 她 深入 到 困难 问题 之 中 ， 直 到 她 完全 理解 该 问题 和 人 解 空 间 ， 她 将 大 量 精力 专注 于 
“使 得 事情 产生 结果 ”， 例 如 在 协议 标准 化 和 网 络 设备 中 注入 了 她 的 很 多 思想 。 同 时 ,通过 在 许多 标准 
化 和 研究 组 织 的 专业 服务 以 及 通过 创建 工具 (例如 广泛 使 用 的 ns2 和 ns3 模拟 器 )， 她 回馈 了 网 络 界 ， 
这 些 工 具 使 得 其 他 研究 人 员 取 得 成 功 。 她 于 2009 年 退休 ， 但 她 在 该 领域 的 影响 将 在 未 来 许多 年 内 长 入 
存在 。 

© 您 对 进入 计算 机 科学 和 网 络 领域 的 学 生 有 什么 忠告 吗 ? 

网 络 本 质 上 是 一 个 跨 学 科 的 领域 。 应 用 来 自 其 他 学 科 的 技术 在 网 络 中 取得 重要 突破 ,这 些 技术 来 
自 不 同 领 域 ， 如 排队 论 、 博 弈 论 、 控 制 论 、 分 布 式 系统 、 网 络 优化 、 编 程 语言 、 机 器 学 习 、 算 法 、 数 
据 结 构 等 等 。 我 认为 熟悉 相关 领域 或 与 这 些 领 域 的 专家 密切 合作 ， 是 将 网 络 建立 在 更 坚实 基础 上 的 极 
好 方式 ， 这 样 我 们 能 够 学 习 如 何 建 造 更 值得 社会 信任 的 网 络 。 除 了 这 些 理论 学 科 以 外 ， 因 为 我 们 能 够 
创造 真实 的 供 人 们 使 用 的 实际 人 造物 品 ， 网 络 是 令 人 激动 的 。 通 过 获取 操作 系统 、 计 算 机 体系 结构 等 
方面 的 经 验 ， 掌 握 如 何 设 计 和 建造 系统 是 另 一 种 了 不 起 的 方式 ， 这 可 以 增强 你 的 网 络 知识 ， 有 助 于 使 
得 世界 更 美好 。 
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伐 路 层 和 局 域 网 





在 上 一 章 中 ， 我 们 学 习 了 网 络 层 提供 的 任意 两 台 主机 之 间 的 通信 服务 。 在 两 台 主 机 之 
间 ， 数 据 报 路 越 一 系列 通信 链 路 传输 ， 一 些 是 有 线 链 路 ， 而 一 些 是 无 线 链 路 ， 从 源 主 机 起 
始 ， 通 过 一 系列 分 组 交换 机 《交换 机 和 路 由 器 ) ， 在 目的 主机 结束 。 当 我 们 沿 协议 栈 继续 
往 下 ， 从 网 络 层 到 达 链 路 层 ， 我 们 自然 而 然 地 想 知道 分 组 是 如 何 通过 构成 端 到 端 通 信 路 径 
的 各 段 链 路 的 。 为 了 在 单 段 链 路 上 传输 ， 网 络 层 的 数据 报 是 怎样 被 封装 进 链 路 层 帧 的 呢 ? 
沿 此 通信 路 径 ， 不 同 的 链 路 能 够 采用 不 同 的 链 路 层 协 议 吗 ? 在 广播 链 路 中 传输 碰撞 是 如 何 
解决 的 ? 在 链 路 层 存 在 编 址 吗 ? 如 果 需 要 ， 链 路 层 编 址 如 何 与 我 们 在 第 4 章 中 学 习 的 网 络 
层 编 址 一 起 运行 呢 ? 交换 机 和 路 由 器 之 间 到 底 有 哪些 差异 ? 我 们 将 在 本 章 回 答 这 些 和 其 他 
一 些 重 要 的 问题 。 

在 链 路 层 的 讨论 中 ,我 们 将 看 到 两 种 截然 不 同类 型 的 链 路 层 信道 。 第 一 种 类 型 是 广播 
信道 ， 这 种 信道 用 于 连接 有 线 局 域 网 、 卫 星 网 和 混合 光纤 同 轴 电 缆 ( Hybrid Fiber Coaxial 
cable, HFC) 接 入 网 中 的 多 台 主 机 。 因 为 许多 主机 与 相同 的 广播 信道 连接 ， 需 要 所 谓 的 媒 
体 访问 协议 来 协调 帧 传输 。 在 某 些 场合 中 ， 可 以 使 用 中 心 控制 器 来 协调 传输 。 第 二 种 类 型 
的 链 路 层 信 道 是 点 对 点 通信 和 链 路 ， 这 在 诸如 长 距离 链 路 连接 的 两 台 路 由 器 之 间 ， 或 用 户 办 
公 室 计 算 机 与 它们 所 连接 的 邻近 以 太 网 交换 机 之 间 等 场合 经 常 能 够 发 现 。 协 调 对 点 对 点 链 
路 的 访问 较为 简单 ; 在 本 书 Web 网 站 上 的 相关 材料 详细 地 讨论 了 点 到 点 协议 (Point- to- 
Point Protocol, PPP) ， 该 协议 的 适用 范围 从 经 电话 线 的 拨号 服务 到 经 光纤 链 路 的 高 速 点 到 
点 帧 传输 。 

我 们 将 在 本 章 中 探究 几 个 链 路 层 概 念 和 技术 。 我 们 将 更 深入 地 研究 差错 检测 和 纠正 ， 
这 个 主题 我 们 在 第 3 章 中 简要 讨论 过 。 我 们 将 考虑 多 路 访问 网 络 和 交换 局 域 网 ， 包 括 以 太 
网 ， 这 是 目前 最 流行 的 有 线 局 域 网 技术 。 我 们 还 将 学 习 虚 拟 局 域 网 和 数据 中 心 网 络 。 尽 管 
WiFi 及 更 一 般 的 无 线 局 域 网 都 属于 链 路 层 范 围 ， 但 我 们 将 在 第 7 章 才学 习 这 些 重要 的 
主题 。 


6.1 链 路 层 概述 


我 们 首先 学 习 一 些 有 用 的 术语 。 在 本 章 中 为 方便 讨论 ， 将 运行 链 路 层 协议 〈 即 第 2 
JZ) 协议 的 任何 设备 均 称 为 节点 〈《node) 。 节 点 包括 主机 、 路 由 器 、 交 换 机 和 WiFi 接 人 点 
(在 第 7 TEP TTC) 。 我 们 也 把 沿 着 通信 路 径 连 接 相 邻 节点 的 通信 信道 称 为 链 路 (link) 。 
为 了 将 一 个 数据 报 从 源 主机 传输 到 目的 主机 ， 数 据 报 必须 通过 沿 端 到 端 路 径 上 的 各 段 链 路 
传输 。 举 例 来 说 ， 显 示 在 图 6-1 下 部 的 公司 网 络 中 ， 考 虑 从 无 线 主机 之 一 向 服务 器 之 一 发 
送 一 个 数据 报 。 该 数据 报 将 实际 通过 6 段 链 路 : 发 送 主机 与 WiFi 接 人 点 之 间 的 WiFi 链 
路 ， 接 人 点 和 链 路 层 交 换 机 之 间 的 以 太 网 链 路 ， 链 路 层 交 换 机 与 路 由 器 之 间 的 链 路 ， 两 台 
路 由 器 之 间 的 链 路 ， 最 后 是 交换 机 和 服务 器 之 间 的 以 太 网 链 路 。 在 通过 特定 的 链 路 时 ， 传 
输 节 点 将 数据 报 封装 在 链 路 层 帧 中 ， 并 将 该 帧 传送 到 链 路 中 。 





图 6-1 无 线 主机 和 服务 器 之 间 的 6 个 链 路 层 跳 


为 了 透彻 理解 链 路 层 以 及 它 是 如 何 与 网 络 层 关联 的 ， 我 们 考虑 一 个 交通 运输 的 类 比例 
子 。 假 如 一 个 旅行 社 计划 为 游客 开辟 从 美国 新 泽 西 州 的 普林斯顿 到 瑞士 洛桑 的 旅游 路 线 。 
假定 该 旅行 社 认 为 对 于 游客 而 言 最 为 便利 的 方案 是 : 从 普林斯顿 乘 豪 华 大 轿车 到 JFK 机 
场 ， 然 后 乘 飞机 从 JEK 机 场 去 日 内 瓦 机 场 ， 最 后 乘 火车 从 日 内 瓦 机 场 到 洛桑 火车 站 。 一 旦 
该 旅行 社 作 了 这 3 项 预定 ， 普 林 斯 顿 察 华 大 轿车 公司 将 负责 将 游客 从 普林斯顿 市 到 JEK, 
航空 公司 将 负责 将 游客 从 JEK 带 到 日 内 瓦 ， 瑞士 火车 服务 将 负责 将 游客 从 日 内 瓦 币 到 洛 
桑 。 该 旅程 中 3 段 中 的 每 一 段 都 在 两 个 “ 相 邻 ”地 点 之 间 是 “直达 的 ”。 注 意 到 这 3 Boia 
输 是 由 不 同 的 公司 管理 ， 使 用 了 完全 不 同 的 运输 方式 〈 豪 华 大 轿车 、 飞 机 和 火车 )。 尽 管 
运输 方式 不 同 ， 但 它们 都 提供 了 将 旅客 从 一 个 地 点 运输 到 相 邻 地 点 的 基本 服务 。 在 这 个 运 
输 类 比 中 ， 一 个 游客 好 比 一 个 数据 报 ， 每 个 运输 区 段 好 比 一 条 链 路 ， 每 种 运输 方式 好 比 一 
种 链 路 层 协 议 ， 而 该 旅行 社 好 比 一 个 路 由 选择 协议 。 


6.1.1 
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链 路 层 提 供 的 服务 


尽管 任 一 链 路 层 的 基本 服务 都 是 将 数据 报 通过 单一 通信 链 路 从 一 个 节点 移动 到 相 邻 节 
点 ， 但 所 提供 的 服务 细节 能 够 随 着 链 路 层 协议 的 不 同 而 变化 。 链 路 层 协议 能 够 提供 的 可 能 
服务 包括 : 


we (framing) 。 在 每 个 网 络 层 数据 报 经 链 路 传送 之 前 ， 几 乎 所 有 的 链 路 层 协 议 都 
要 将 其 用 链 路 层 帧 封装 起 来 。 一 个 帧 由 一 个 数据 字段 和 知 干 首部 字段 组 成 ， 其 中 
网 络 层 数 据 报 就 插 在 数据 字段 中 。 帧 的 结构 由 链 路 层 协议 规定 。 当 我 们 在 本 章 的 
后 半 部 分 研究 具体 的 链 路 层 协议 时 ， 将 看 到 几 种 不 同 的 帧 格式 。 

链 路 接 入 。 媒 体 访 问 控制 (Medium Access Control, MAC) 协议 规定 了 帧 在 链 路 上 
传输 的 规则 。 对 于 在 链 路 的 一 端 仅 有 一 个 发 送 方 、 链 路 的 男 一 端 仅 有 一 个 接收 方 
的 点 对 点 链 路 ，MAC 协议 比较 简单 (或 者 不 存在 )， 即 无 论 何 时 链 路 空间， 发 送 
方 都 能 够 发 送 帧 。 更 有 趣 的 情况 是 当 多 个 节点 共享 单个 广播 链 路 时 ， 即 所 谓 多 路 
访问 问题 。 这 里 ，MAC 协议 用 于 协调 多 个 节点 的 帧 传输 。 

可 靠 交 付 。 当 链 路 层 协议 提供 可 靠 交 付 服务 时 ， 它 保证 无 差错 地 经 链 路 层 移动 每 个 
网 络 层 数 据 报 。 前 面 讲 过 ， 某 些 运 输 层 协议 (例如 TCP) 也 提供 可 靠 交 付 服务 。 与 
运输 层 可 靠 交 付 服务 类 似 ， 链 路 层 的 可 靠 交 付 服务 通常 是 通过 确认 和 重 传 取得 的 
(参见 3.4 节 )。 链 路 层 可 靠 交 付 服务 通常 用 于 易于 产生 高 差错 率 的 链 路 ， 例 如 无 线 
链 路 ， 其 目的 是 本 地 (也 就 是 在 差错 发 生 的 链 路 上 ) 纠正 一 个 差错 ， 而 不 是 通过 运 
输 层 或 应 用 层 协 议 人 迫使 进行 端 到 端的 数据 重 传 。 然 而 ， 对 于 低 比 特 差错 的 链 路 ， 包 
括 光 纤 、 同 轴 电 缆 和 许多 双 绞 钢 线 链 路 ， 链 路 层 可 靠 交 付 可 能 会 被 认为 是 一 种 不 必 
要 的 开销 。 由 于 这 个 原因 ， 许 多 有 线 的 链 路 层 协 议 不 提供 可 靠 交 付 服务 。 

差错 检测 和 纠正 。 当 帧 中 的 一 个 比特 作为 1 传输 时 ， 接 收 方 节点 中 的 链 路 层 人 硬件 
可 能 不 正确 地 将 其 判断 为 0， 反 之 亦 然 。 这 种 比特 差错 是 由 信号 衰减 和 电磁 噪声 导 
致 的 。 因 为 没有 必要 转发 一 个 有 差错 的 数据 报 ， 所 以 许多 链 路 层 协议 提供 一 种 机 
制 来 检测 这 样 的 比特 差错 。 通 过 让 发 送 节点 在 帧 中 包括 差错 检测 比特 ， 让 接收 节 
点 进行 差错 检查 ， 以 此 来 完成 这 项 工作 。 第 3 章 和 第 4 章 讲 过 ， 因 特 网 的 运输 层 
和 网 络 层 也 提供 了 有 限 形式 的 差错 检测 ， 即 因特网 检验 和 。 链 路 层 的 差错 检测 通 
常 更 复杂 ， 并 且 用 硬件 实现 。 差 错 纠 正 类 似 于 差错 检测 ， 区 别 在 于 接收 方 不 仅 能 
检测 帧 中 出 现 的 比特 差错 ， 而 且 能 够 准确 地 确定 帧 中 的 差错 出 现 的 位 置 (并 因此 
纠正 这 些 差错 ) 。 


6.1.2 链 路 层 在 何 处 实现 


在 深入 学 习 链 路 层 的 细节 之 前 ， 本 概述 的 最 后 一 节 考 虑 一 下 在 何 处 实现 链 路 层 的 问 
题 。 我 们 将 关注 一 个 端 系 统 ， 因 为 我 们 在 第 4 章 中 知道 链 路 层 是 实现 在 路 由 器 的 线路 卡 中 
的 。 主 机 的 链 路 层 是 用 硬件 还 是 用 软件 实现 的 呢 ? 它 是 实现 在 一 块 单独 的 卡 上 还 是 一 个 芯 
片上 ? 它 是 怎样 与 主机 的 人 硬件 和 操作 系统 组 件 的 其 他 部 分 接口 的 呢 ? 

图 6-2 显示 了 一 个 典型 的 主机 体系 结构 。 链 路 层 的 主体 部 分 是 在 网 络 适配器 (network 
adapter) 中 实现 的 ， 网 络 适 配 郑 有 时 也 称 为 网 络 接口 卡 (Network Interface Card，NIC ) 。 
位 于 网 络 适 配 融 核心 的 是 链 路 层 控 制 器 ， 该 控制 器 通常 是 一 个 实现 了 许多 链 路 层 服 务 (成 
帧 、 链 路 接 入 、 差 错 检 测 等 ) 的 专用 芯片 。 因 此 ， 链 路 层 控 制 器 的 许多 功能 是 用 硬件 实现 
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的 。 例 如 ，Intel 的 710 控制 器 [Intel 2016] 实现 了 以 太 网 协议 ， 我 们 将 在 6.5 市 中 学 习 该 
协议 ; Atheros AR5006[ Atheros 2016] 控制 器 实现 了 802.11 WiFi 协议 ， 我 们 将 在 第 7 章 学 
习 该 协议 。 直 到 20 世纪 90 年 代 后 期 ， 大 部 分 网 络 适 配 需 还 是 物理 上 分 离 的 卡 〈 如 一 块 
PCMCIA 卡 或 者 一 块 插 进 PC 的 PCI 卡 槽 中 的 插入 卡 ) ， 但 越 来 越 多 的 网 络 适 配 需 被 综合 进 
主机 的 主板 ， 即 所 谓 的 局 域 网 在 主板 配置 。 

在 发 送 端 ， 控 制 器 取得 了 由 协议 栈 较 高 层 生 成 并 存储 在 主机 内 存 中 的 数据 报 ， 在 链 路 
层 帧 中 封装 该 数据 报 (填写 该 帧 的 各 个 字段 ) ， 然 后 遵循 链 路 接 和 人 协议 将 该 帧 传 进 通信 链 
路 中 。 在 接收 端 ， 控 制 器 接收 了 整个 帧 ， 抽 取出 网 络 层 数据 报 。 如 果 链 路 层 执行 差错 检 
测 ， 则 需要 发 送 控制 器 在 该 帧 的 首部 设置 差错 检测 比特 ， 由 接收 控制 器 执行 差错 检测 。 

图 6-2 显示 了 与 主机 总 线 (例如 一 条 PCI 或 PCI-X 总 线 ) 连接 的 网 络 适 配器 ， 这 里 它 
看 起 来 非常 像 与 其 他 主机 组 件 连接 的 任何 其 主机 
他 1/0 设备 。 图 6-2 还 显示 了 尽管 大 部 分 链 
路 层 是 在 硬件 中 实现 的 ， 但 部 分 链 路 层 是 在 
运行 于 主机 CPU 上 的 软件 中 实现 的 。 链 路 层 
的 软件 组 件 实现 了 高 层 链 路 层 功 能 ， 如 组 法 
链 路 层 寻 址 信息 和 激活 控制 希 便 件 。 在 接收 
端 ， 链 路 层 软件 响应 控制 器 中 断 〈 例 如 ， 由 
于 一 个 或 多 个 帧 的 到 达 ) ， 处 理 差错 条 件 和 
将 数据 报 向 上 传递 给 网 络 层 。 所 以 ， 链 路 层 
是 硬件 和 软件 的 结合 体 ， 即 此 处 是 协议 栈 中 
软件 与 硬件 交接 的 地 方 。 [ Intel 2016] 从 软 
件 编程 的 角度 提供 了 有 关 XL 710 种 和 名 的 可 。 图 6-2 网 络 适 配器 ， 它 与 其 他 主机 组 件 及 
读 性 很 强 的 概述 〈 以 及 详细 的 描述 ) 。 协议 栈 功能 的 关系 


6.2 差错 检测 和 纠正 技术 


在 上 一 节 中 ， 我们 提 到 了 比特 级 差错 检测 和 纠正 (bit- level error detection and correc- 
tion) ， 即 对 从 一 个 节点 发 送 到 另 一 个 物理 上 连接 的 邻近 节点 的 链 路 层 帧 中 的 比特 损伤 进行 
检测 和 纠正 ， 它 们 通常 是 链 路 层 提 供 的 两 种 服务 。 我 们 在 第 3 章 中 看 到 差错 检测 和 纠正 服 
务 通常 也 由 运输 层 提 供 。 在 本 节 中 ， 我 们 将 研究 几 种 最 简单 的 技术 ， 它 们 能 够 用 于 检测 比 
特 差 错 ， 而 且 在 某 些 情况 下 ， 能 够 纠正 这 样 的 比特 差错 。 对 该 主题 理论 和 实现 的 全 面 描述 
是 许多 教科 书 的 主题 (例如 [Schwartz 1980] 或 [Bertsekas 1991 ] ) ， 而 我 们 这 里 仅 讨 论 
必要 内 容 。 我 们 此 时 的 目的 是 对 差错 检测 和 纠正 技术 提供 的 能 力 有 一 种 直观 的 认识 ， 并 看 
看 一 些 简单 技术 在 链 路 层 中 的 工作 原理 及 其 如 何 实 际 应 用 。 

图 6-3 图 示 说 明了 我 们 研究 的 环境 。 在 发 送 布 点， 为 了 保护 比特 免 受 差错 ， 使 用 差错 
检测 和 纠正 比特 ( Error- Detection and- Correction, EDC) 来 增强 数据 D。 通 常 ， 要 保护 的 
数据 不 仅 包括 从 网 络 层 传递 下 来 需要 通过 链 路 传输 的 数据 报 ， 而 且 包 括 链 路 帧 首部 中 的 链 
路 级 的 寻 址 信息 、 序 号 和 其 他 字段 。 链 路 级 帧 中 的 D Al EDC 都 被 发 送 到 接收 节点 。 在 接 
收 节点 ， 接 收 到 比特 序列 D' 和 EDC'。 注 意 到 因 传 输 中 的 比特 翻转 所 致 ，D' 和 EDC' 可 能 与 
初始 的 D 和 EDC 不 同 。 

接收 方 的 挑战 是 在 它 只 收 到 D'A EDC' 的 情况 下 ,确定 D' 是 否 和 初始 的 D 相同 。 在 


主机 总 线 
(例如 PCI) 


网 络 适配器 
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图 6-3 中 的 接收 方 判定 的 准确 措辞 〈 我 们 问 是 否 检测 到 一 个 差错 ， 而 非 是 否 出 现 了 差错 !) 
是 重要 的 。 差 错 检测 和 纠正 技术 使 接收 方 有 时 但 并 总 是 检测 出 已 经 出 现 的 比特 差错 。 即 使 
采用 差错 检测 比特 ， 也 还 是 可 能 有 未 检 出 比特 差错 (undetected bit error); 这 就 是 说 ， 接 
收 方 可 能 无 法 知道 接收 的 信息 中 包含 着 比特 差错 。 因 此 ， 接 收 方 可 能 向 网 路 层 交 付 一 个 损 
伤 的 数据 报 ， 或 者 不 知道 该 帧 首部 的 某 个 其 他 字段 的 内 容 已 经 损伤 。 我 们 因此 要 选择 一 个 
差错 检测 方案 ,使 得 这 种 事件 发 生 的 概率 很 小 。 一 般 而 言 ， 差 错 检 测 和 纠 错 技术 越 复 杂 
( 即 那些 具有 未 检测 出 比特 差错 概率 较 小 的 技术 ) ， 导 致 的 开销 就 越 大 ， 这 就 是 意味 着 需要 
更 多 的 计算 量 及 更 多 的 差错 检测 和 纠 错 比特 。 


数据 报 









易 出 现 比特 差错 的 链 路 
图 6-3 ”差错 检测 与 纠正 的 场景 
我 们 现在 来 研究 在 传输 数据 中 检测 差错 的 3 种 技术 : 奇偶 校 验 ( 它 用 来 描述 差错 检测 


和 纠正 背后 隐 含 的 基本 思想 ) 、 检 验 和 方法 ( 它 通常 更 多 地 应 用 于 运输 层 ) 和 循环 宛 余 检 
测 ( 它 通常 更 多 地 应 用 在 适配器 中 的 链 路 层 ) 。 


6.2.1 奇偶 校 验 


也 许 差错 检测 最 简单 的 方式 就 是 用 单个 奇偶 校 验 位 〈parity bit) 。 假 设 在 图 6-4 中 要 发 
送 的 信息 忆 有 比特。 在 偶 校 验方 案 中 ， 发 送 方 只 需 
包含 一 个 附加 的 比特 ， 选 择 它 的 值 ， 使 得 这 d+1 比 
特 (初始 信息 加 上 一 个 校 验 比特 ) 中 1 的 总 数 是 偶 ono 00110101011. nie Gl 
数 。 对 于 奇 校 验方 案 ， 选 择 校 验 比特 值 使 得 有 奇数 个 ee eee 
1。 图 6-4 描述 了 一 个 偶 校 验 的 方案 ， 单 个 校 验 比特 被 图 6-4 1 比特 偶 校 验 
存放 在 一 个 单独 的 字段 中 。 

采用 单个 奇偶 校 验 位 方式 ， 接 收 方 的 操作 也 很 简单 。 接 收 方 只 需要 数 一 数 接收 的 d +1 
比特 中 1 的 数目 即 可 。 如 果 在 采用 偶 校 验 方案 中 发 现 了 奇数 个 值 为 1 的 比特 ， 接 收 方 知道 
至 少 出 现 了 一 个 比特 差错 。 更 精确 的 说 法 是 ， 出 现 了 奇数 个 比特 差错 。 

但 是 如 果 出 现 了 偶数 个 比特 差错 ， 那 会 发 生 什么 现象 呢 ? 你 应 该 认识 到 这 将 导致 一 个 
未 检 出 的 差错 。 如 果 比 特 差错 的 概率 小 ， 而 且 比 特 之 间 的 差错 可 以 被 看 作 是 独立 发 生 的 ， 
在 一 个 分 组 中 多 个 比特 同时 出 错 的 概率 将 是 极 小 的 。 在 这 种 情况 下 ， 单 个 奇偶 校 验 位 可 能 
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发 生 。 在 突 发 差错 的 情况 下 ， 使 用 单 比 特 奇偶 校 验 保护 的 一 帧 中 未 检测 出 差 销 的 概率 能 够 
达到 50% [Spragins 1991 ] 。 显 然 ， 需 要 一 个 更 健壮 的 差错 检测 方案 (幸运 的 是 实践 中 正 
在 使 用 这 样 的 方式 !) 。 但 是 在 研究 实践 中 使 用 的 差错 检测 方案 之 前 ， 我 们 考虑 对 单 比特 奇 
偶 校 验 的 一 种 简单 一 般 化 方案 ， 这 将 使 我 们 深入 地 理解 纠 错 技术 。 

图 6-5 显示 了 单 比特 奇偶 校 验 方案 的 二 维 一 般 化 方案 。 这 里 D 中 的 d 个 比特 被 划分 为 ; 
行 j 列 。 对 每 行 和 每 列 计算 奇偶 值 。 产 生 的 行 校 验 
i+]j+1 奇偶 比特 构成 了 链 路 层 帧 的 差错 检测 
比特 。 

现在 假设 在 初始 d 比特 信息 中 出 现 了 
单个 比特 差错 。 使 用 这 种 二 维 奇偶 校 验 
(two-dimensional parity) 方案 ， 包 含 比 特 值 
改变 的 列 和 行 的 校 验 值 都 将 会 出 现 差错 。 
因此 接收 方 不 仅 可 以 检测 到 出 现 了 单个 比 
特 差 错 的 事实 ， 而 且 还 可 以 利用 存在 奇偶 
校 验 差 错 的 列 和 行 的 索引 来 实际 识别 发 生 
差错 的 比特 并 纠正 它 ! 图 6-5 显示 了 一 个 例 
子 ， 其 中 位 于 (2, 2) 的 值 为 1 的 比特 损 
坏 了 ， 变 成 了 0， 该 差错 就 是 一 个 在 接收 方 
可 检测 并 可 纠正 的 差错 。 尽 管 我 们 的 讨论 
是 针对 初始 d 比特 信息 的 , 但 校 验 比特 本 
身 的 单个 比特 差错 也 是 可 检测 和 可 纠正 的 。 
二 维 奇偶 校 验 也 能 够 检测 (但 不 能 纠正 !) 图 6-5 二 维 偶 校 验 
一 个 分 组 中 两 个 比特 差错 的 任何 组 合 。 二 维 奇 偶 校 验方 案 的 其 他 特性 将 在 本 和 草 后 面 的 习题 
中 进行 探讨 。 

接收 方 检测 和 纠正 差错 的 能 力 被 称 为 前 向 纠 错 (Forward Error Correction, FEC), ix 
些 技 术 通 常用 于 如 音频 CD 这 样 的 音频 存储 和 回放 设备 中 。 在 网 络 环境 中 ，FEC 技术 可 以 
单独 应 用 ， 或 与 链 路 层 ARQ 技术 一 起 应 用 ，ARQ 技术 与 我 们 在 第 3 章 研 究 的 协议 类 似 。 
FEC 技术 很 有 价值 ， 因 为 它们 可 以 减少 所 需 的 发 送 方 重 发 的 次 数 。 也 许 更 为 重要 的 是 ， 它 
们 允许 在 接收 方 立即 纠正 差错 。FEC 避免 了 不 得 不 等 待 的 往返 时 延 ， 而 这 些 时 延 是 发 送 方 收 
到 NAK 分 组 并 向 接收 方 重 传 分 组 所 需要 的 ， 这 对 于 实时 网 络 应 用 [Rubenstein 1998] 或 者 具 
有 长 传播 时 延 的 链 路 〈 如 次 空间 链 路 ) 可 能 是 一 种 非常 重要 的 优点 。 研 究 差错 控制 协议 中 
FEC 的 使 用 的 资料 包括 [ Biersack 1992; Nonnenmacher 1998; Byers 1998; Shacham 1990 | 。 


6.2.2 检验 和 方法 


在 检验 和 技术 中 ， 图 6-4 中 的 d 比特 数据 被 作为 一 个 比特 整数 的 序列 处 理 。 一 个 简 
单 检验 和 方法 就 是 将 这 上 比特 整数 加 起 来 ， 并 且 用 得 到 的 和 作为 差错 检测 比特 。 因 特 网 检 
验 和 (Internet checksum) 就 基于 这 种 方法 ， 即 数据 的 字 节 作为 16 比特 的 整数 对 待 并 求 
和 。 这 个 和 的 反 码 形 成 了 携带 在 报 文 段 首部 的 因特网 检验 和 。 如 在 3.3 节 讨论 的 那样 ， 接 
收 方 通过 对 接收 的 数据 (包括 检验 和 ) 的 和 取 反 码 ， 并 且 检 测 其 结果 是 否 为 全 1 比特 来 检 
测 检验 和 。 如 果 这 些 比 特 中 有 任何 比特 是 0， 就 可 以 指示 出 差错 。RFC 1071 详细 地 讨论 因 
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特 网 检验 和 算法 和 它 的 实现 。 在 TCP 和 UDP 协议 中 ， 对 所 有 字段 (包括 首部 和 数据 字段 ) 
都 计算 因特网 检验 和 。 在 其 他 协议 中 ,例如 XTP [Strayer 1992], ， 对 首部 计算 一 个 检验 和 ， 
对 整个 分 组 计算 为 一 个 检验 和 。 

检验 和 方法 需要 相对 小 的 分 组 开销 。 例 如 ，TCP 和 UDP 中 的 检验 和 只 用 了 16 比特 。 
然而 ， 与 后 面 要 讨论 的 常用 于 链 路 层 的 CRC 相 比 ， 它 们 提供 相对 弱 的 差错 保护 。 这 时 ， 
一 个 很 自然 的 问题 是 : 为 什么 运输 层 使 用 检验 和 而 链 路 层 使 用 CRC YE? 前 面 讲 过 运输 层 
通常 是 在 主机 中 作为 用 户 操 作 系 统 的 一 部 分 用 软件 实现 的 。 因 为 运输 层 差错 检测 用 软件 实 
现 ， 采 用 简单 而 快速 如 检验 和 这 样 的 差错 检测 方案 是 重要 的 。 在 另 一 方面 ， 链 路 层 的 差错 
检测 在 适配器 中 用 专用 的 人 硬件 实现 ， 它 能 够 快速 执行 更 复杂 的 CRC 操作 。Feldmeier[ Feld- 
meier 1995 ] 描述 的 快速 软件 实现 技术 不 仅 可 用 于 加 权 检 验 和 编码 ， 而 且 可 用 于 CRC ( 见 
后 面 ) 和 其 他 编码 。 


6. 2.3 循环 元 余 检测 


现今 的 计算 机 网 络 中 广泛 应 用 的 差错 检测 技术 基于 循环 元 余 检测 (Cyclic Redundancy 
Check, CRC) 编码 。CRC 编码 也 称 为 多 项 式 编码 (polynomial code) ， 因 为 该 编码 能 够 将 要 
发 送 的 比特 串 看 作为 系数 是 0 和 1 一 个 多 项 式 ， 对 比特 串 的 操作 被 解释 为 多 项 式 算术 。 
CRC 编码 操作 如 下 。 考 虑 d 比特 的 数据 D， 发 送 节点 要 将 它 发 送 给 接收 节点 。 发 送 方 
和 接收 方 首先 必须 协商 一 个 r+1 比特 模式 ， 称 为 生成 多 项 式 ( generator) ， 我 们 将 其 表示 
为 C。 我 们 将 要 求 G 的 最 高 有 效 位 的 比特 (最 左边 ) 是 1。CRC 编码 的 关键 思想 如 图 6-6 
所 示 。 对 于 一 个 给 定 的 数据 段 D， 发 送 方 要 选择 7 个 附加 比特 R, de 
使 得 得 到 的 d + r 比特 模式 (被 解释 为 一 4 比特 
个 二 进 制 数 ) 用 模 2 算术 恰好 能 被 C 整除 Eee 
( 即 没有 余数 ) 。 用 CRC 进行 差错 检测 的 过 。 De 被 发 送 的 数据 比特 | R: CRC 比特 。 比特 模式 
程 因此 很 简单 : 接收 方 用 G 去除 接收 到 的 ra ”数学 公式 
d +r 比特 。 如 果 余 数 为 非 零 ， 接 收 方 知道 
出 现 了 差错 ; 否则 认为 数据 正确 而 被 接收 。 
所 有 CRC 计算 采用 模 2 算术 来 做 ， 在 加 法 中 不 进位 ， 在 减法 中 不 借 位 。 这 意味 着 加 
法 和 减法 是 相同 的 ， 而 且 这 两 种 操作 等 价 于 操作 数 的 按 位 异 或 (XOR) 。 因 此 ， 举 例 来 说 : 
1011 XOR 0101 =1110 
1001 XOR 1101 =0100 


图 6-6 CRC 


WHE, 我 们 还 会 有 : 
1011 -0101 = 1110 
1001 - 1101 = 0100 
除了 所 需 的 加 法 或 减法 操作 没有 进位 或 借 位 外 ， 乘 法 和 除法 与 在 二 进 制 算 术 中 是 相同 
的 。 如 在 通常 的 二 进 制 算 术 中 那样 ， 乘 以 2 就 是 以 一 种 比特 模式 左 移 上 个 位 置 。 这 样 ， 给 
定 D 和 R,D:2 XORR 产生 如 图 6-6 所 示 的 d+r 比特 模式 。 在 下 面 的 讨论 中 ， 我 们 将 利用 
图 6-6 中 这 种 d +r 比特 模式 的 代数 特性 。 
现在 我 们 回 到 发 送 方 怎样 计算 R 这 个 关键 问题 上 来 。 前 面 讲 过 ， 我 们 要 求 出 RR 使 得 对 
于 n 有 : 
D-2'XORR =nG 
也 就 是 说 ， 我 们 要 选择 R 使 得 G 能 够 除 以 D :2 XOR R 而 没有 余数 。 如 果 我 们 对 上 述 


292 #£6# 


等 式 的 两 边 都 用 RR 异 或 ( 即 用 模 2 加 ， 而 没有 进位 ) ， 我 们 得 到 
D+2' =nGXORR 
这 个 等 式 告诉 我 们 ， 如 果 我 们 用 G 来 除 D+ 2 ， 余 数值 刚好 是 R。 换 句 话 说 ， 我 们 可 
以 这 样 计算 R: 
G 
图 6-7 举例 说 明了 在 D=101110,d =6，G = 1001 和 r =3 的 情况 下 的 计算 过 程 。 在 这 种 
情况 下 传输 的 9 个 比特 是 101110011。 你 应 该 自行 检查 一 下 





R = remainder 





这 些 计 算 ， 并 核对 一 下 D - 2' = 101011 - G XOR R 的 确 一 a ERA. 
成 立 Loe. | i Oo. dae 0 0 0 
> 1-0 @ i 
国际 标准 已 经 定义 了 8、12 、16 和 32 比特 生成 多 项 式 101 ‘ 
00 0 


Go CRC-32 32 比特 的 标准 被 多 种 链 路 级 IEEE 协议 采用 ， A: 
使 用 的 一 个 生成 多 项 式 是 : es 





O — 














Gerc.a2 = 1000001001 10000010001110110110111 110 
每 个 CRC 标准 都 能 检测 小 于 r+1 比特 的 突 发 差错 。 aa 
(这 意味 着 所 有 连续 的 r 比特 或 者 更 少 的 差错 都 可 以 检测 10 0 1- 
到 。) 此 外 ， 在 适当 的 假设 下 ， 长 度 大 于 r+1 比特 的 突 发 1011 
差错 以 概率 1 -0.5' 被 检测 到 。 每 个 CRC 标准 也 都 能 检测 : 7 
任何 奇数 个 比特 差错 。 有 关 CRC 检测 实现 的 讨论 可 参见 -一 一 
[ Williams 1993], CRC 编码 甚至 更 强 的 编码 所 依据 的 理论 


超出 了 本 书 的 范围 。 教 科 书 [Schwartz 1980] 对 这 个 主题 ”图 6-7 一 个 简单 的 CRC 计算 
提供 了 很 好 的 介绍 。 


6.3 多 路 访问 链 路 和 协议 


在 本 章 概述 中 ， 我 们 提 到 了 有 两 种 类 型 的 网 络 链 路 : 点 对 点 链 路 和 广播 链 路 。 点 对 点 
链 路 (point-to-point link) 由 链 路 一 端的 单个 发 送 方 和 链 路 另 一 端的 单个 接收 方 组 成 。 许 
多 链 路 层 协议 都 是 为 点 对 点 链 路 设计 的 ， 如 点 对 点 协议 (point-to-point protocol, PPP) 和 
高 级 数据 链 路 控制 (high-level data link control, HDLC) 就 是 两 种 这 样 的 协议 ， 我 们 将 在 
本 章 后 面 涉 及 它们 。 第 二 种 类 型 的 链 路 是 广播 链 路 (broadcast link ) ， 它 能 够 让 多 个 发 送 
和 接收 节点 都 连接 到 相同 的 、 单 一 的 、 共 享 的 广播 信道 上 。 这 里 使 用 术语 “广播 ”是 因为 
当 任何 一 个 节点 传输 一 个 帧 时 ， 信 道 广播 该 帧 ， 每 个 其 他 节点 都 收 到 一 个 副本 。 以 太 网 和 
无 线 局 域 网 是 广播 链 路 层 技 术 的 例子 。 在 本 节 ， 我 们 暂缓 讨论 特定 的 链 路 层 协议 ， 而 先 研 
究 一 个 对 链 路 层 很 重要 的 问题 : 如 何 协 调 多 个 发 送 和 接收 节点 对 一 个 共享 广播 信道 的 访 
问 ， 这 就 是 多 路 访问 问题 (multiple access problem) 。 广 播 信道 通常 用 于 局 域 网 中 ， 局 域 网 
是 一 个 地 理 上 集中 在 一 座 建筑 物 中 (或 者 在 一 个 公司 ， 或 者 在 大 学 校园 ) 的 网 络 。 因 此 我 
们 还 将 在 本 节 后 面 考察 一 下 多 路 访问 信道 是 如 何在 局 域 网 中 使 用 的 。 

我 们 都 很 熟悉 广播 的 概念 ， 因 为 自 电 视 发 明 以 来 就 使 用 了 这 种 通信 方式 。 但 是 传统 的 
电视 是 一 种 一 个 方向 的 广播 〈( 即 一 个 固定 的 节点 同 许 多 接收 节点 传输 ) ， 而 计算 机 网 络 广 
播 信道 上 的 节点 既 能 够 发 送 也 能 够 接收 。 也 许 对 广播 信道 的 一 个 更 有 人 情 味 的 类 比 是 鸡 尾 
酒会 ， 在 那里 许多 人 聚集 在 一 个 大 房间 里 (空气 为 提供 广播 的 媒体 ) 谈论 和 倾听 。 第 二 个 
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切 题 的 类 比 是 许多 读者 都 很 熟悉 的 地 方 ， 即 一 间 教 室 ， 在 那里 老师 们 和 同学 们 同样 共享 相 
同 的 、 单 一 的 广播 媒体 。 在 这 两 种 场景 下 ， 一 个 中 心 问题 是 确定 谁 以 及 在 什么 时 候 获 得 说 
话 权 力 (也 就 是 向 信道 传输 )。 作 为 人 类 ， 为 了 共享 这 种 广播 信道 ， 我 们 已 经 演化 得 到 了 
一 个 精心 设计 的 协议 集 了 : 

“给 每 个 人 一 个 讲话 的 机 会 。” 

“该 你 讲话 时 你 才 说 话 。” 

“不 要 一 个 人 独占 整个 谈话 。” 

“如 果 有 问题 请 举 手 。” 

“ 当 有 人 讲话 时 不 要 打 断 。” 

“ 当 其 他 人 讲话 时 不 要 睡觉 。 

计算 机 网 络 有 类 似 的 协议 ， 也 就 是 所 谓 的 多 路 访问 协议 (multiple access protocol), Ef) 

节点 通过 这 些 协议 来 规范 它们 在 共享 的 广播 信道 上 的 传输 行为 。 如 图 6-8 所 示 ， 在 各 种 各 
样 的 网 络 环境 下 需要 多 路 访问 协议 ， 包 括 有 线 和 无 线 接 人 了 网， 以 及 卫星 网 络 。 尽 管 从 技术 
上 讲 每 个 节点 通过 它 的 适配器 访问 广播 信道 ， 但 在 本 节 中 我 们 将 把 节点 作为 发 送 和 接收 设 
备 。 在 实践 中 ， 数 以 百 计 或 者 甚至 数 以 千 计 个 节点 能 够 通过 一 个 广播 信道 直接 通信 。 


线 共享 无 线 共享 
(例如 电缆 接 入 网 ) “例如 WiFi) 


«> 
ayy 





图 6-8 多 种 多 路 访问 信道 


因为 所 有 的 节点 都 能 够 传输 帧 ， 所 以 多 个 节点 可 能 会 同时 传输 帧 。 当 发 生 这 种 情况 
时 ， 所 有 节点 同时 接 到 多 个 帧 ; 这 就 是 说 ,传输 的 帧 在 所 有 的 接收 方 处 碰撞 (collide ) 
了 。 通 常 ， 当 碰撞 发 生 时 ， 没 有 一 个 接收 节点 能 够 有 效 地 获得 任何 传输 的 帧 ;在 某 种 意义 
下 ， 和 碰撞 帧 的 信号 纠缠 在 一 起 。 因 此 ， 涉 及 此 次 碰撞 的 所 有 帧 都 丢失 了 ， 在 碰撞 时 间 间 陋 
中 的 广播 信道 被 浪费 了 。 显 然 ， 如 果 许 多 节点 要 频繁 地 传输 帧 ， 许 多 传输 将 导致 碰撞 ， 广 
播 信道 的 大 量 带宽 将 被 浪费 掉 。 

当 多 个 节点 处 于 活跃 状态 时 ， 为 了 确保 广播 信道 执行 有 用 的 工作 ， 以 某 种 方式 协调 活 
跃 节点 的 传输 是 必要 的 。 这 种 协调 工作 由 多 路 访问 协议 负责 。 在 过 去 的 40 年 中 , 已 经 有 
上 千 篇 文章 和 上 百 篇 博士 论文 研究 过 多 路 访问 协议 ; 有 关 这 部 分 工作 前 20 年 来 的 一 个 内 
容 丰 富 的 综述 见 | Rom 1990 |。 此 外 ， 由 于 新 类 型 链 路 尤其 是 新 的 无 线 链 路 不 断 出 现 ， 在 
多 路 访问 协议 方面 研究 的 活跃 状况 仍 在 继续 。 
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这 些 年 来 ， 在 大 量 的 链 路 层 技 术 中 已 经 实现 了 几 十 种 多 路 访问 协议 。 尽 管 如 此 ， 我 们 
能 够 将 任何 多 路 访问 协议 划分 为 3 种 类 型 之 一 : 信道 划分 协议 (channel partitioning proto- 
col) ， 随 机 接 入 协议 (random access protocol) 和 轮流 协议 (taking-turns protocol ) 。 我 们 将 
在 后 续 的 3 个 小 节 中 讨论 这 几 类 多 路 访问 协议 。 

在 结束 概述 之 前 ， 我们 给 出 下 列 条 件 。 在 理想 情况 下 ， 对 于 速率 为 R bps 的 广播 信 
道 ， 多 路 访问 协议 应 该 具有 以 下 所 希望 的 特性 : 

1) 当 仅 有 一 个 节点 发 送 数 据 时 ， 该 节点 具有 R bps HAIE; 

2) 当 有 MM 个 节点 发 送 数 据 时 ， 每 个 节点 否 吐 量 为 RAM bps。 这 不 必要 求 M 个 节点 中 
的 每 一 个 节点 总 是 有 R/M 的 瞬间 速率 ， 而 是 每 个 节点 在 一 些 适 当 定 义 的 时 间 间 隔 内 应 该 
有 R/M 的 平均 传输 速率 。 

3) 协议 是 分 散 的 ; 这 就 是 说 不 会 因 某 主 节 点 故障 而 使 整个 系统 衣 溃 。 

4) 协议 是 简单 的 ， 使 实现 不 昂贵 。 


6. 3.1 信道 划分 协议 


我 们 前 面 在 1.3 节 讨 论 过 ， 时 分 多 路 复 用 (TDM) 和 频 分 多 路 复 用 (FDM) 是 两 种 
ee eee di 举例 来 说 ， 假 设 一 个 支持 入 
个 节点 的 信道 且 信 道 的 传输 速率 为 R 


bps, TDM 将 时 间 划 分 为 时 间 帧 (time «M 
frame) ， 并 进一步 划分 每 个 时 间 帧 为 V 个 

时 隙 〈slot) 。 (不 应 当 把 TDM 时 间 帧 与 Ed 
在 发 送 和 接收 适配器 之 间 交 换 的 链 路 层 HEL 

数据 单元 相 混淆 ， 后 者 也 被 称 为 帧 。 为 
了 减少 混乱 ， 在 本 小 节 中 我 们 将 链 路 层 


交换 的 数据 单元 称 为 分 组 ,) 然后 把 每 个 
时 际 分 配给 NN 个 节点 中 的 一 个 。 无 p“ 





时 某 个 节点 在 有 分 组 要 发 送 的 时 候 ，; 

在 循环 的 TDM saa BL Se 

答 分 组 比特 。 通 常 ， 选 择 的 时 队长 度 应 wt eel 

使 一 个 时 隙 内 能 够 传输 单个 分 组 。 图 6-9 | | 
表示 一 个 简单 的 4 个 节点 的 TDM 例子 。 We cr TR MT ee ens 


再 回 到 我 们 的 鸡尾酒 会 类 比 中 ， 一 个 采用 TDM 规则 的 鸡尾酒 会 将 允许 每 个 聚会 客人 在 固 
定 的 时 间 段 发 言 ， 然 后 再 允许 另 一 个 聚会 客人 发 言 同 样 时 长 ， 以 此 类 推 。 一 旦 每 个 人 都 有 
了 说 话机 会 ， 将 不 断 重 复 着 这 种 模式 。 

TDM 是 有 吸引 力 的 ， 因 为 它 消 除了 碰撞 而 且 非 常 公平 : 每 个 节点 在 每 个 帧 时 间 内 得 
到 了 专用 的 传输 速率 RAN bps。 然 而 它 有 两 个 主要 缺陷 。 首 先 ， 节 点 被 限制 于 RAN bps 的 
平均 速率 ， 即 使 当 它 是 唯一 有 分 组 要 发 送 的 节点 时 。 其 次 ， 节 点 必须 总 是 等 待 它 在 传输 序 
列 中 的 轮 次 ， 即 我 们 再 次 看 到 ， 即 使 它 是 唯一 一 个 有 帧 要 发 送 的 节点 。 想 象 一 下 某 聚 会 客 
人 是 唯一 一 个 有 话 要 说 的 人 的 情形 〈 并 且 想 象 一 下 这 种 十 分 罕见 的 情况 ， 即 酒会 上 所 有 的 
人 都 想 听 某 一 个 人 说 话 ) 。 显 然 ， 一 种 多 路 访问 协议 用 于 这 个 特殊 聚会 时 ，TDM 是 一 种 很 
糟 的 选择 。 

TDM 在 时 间 上 共享 广播 信道 ， 而 FDM 将 R bps 信道 划分 为 不 同 的 频段 (每 个 频段 
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具有 R/N 带宽 ) ， 并 把 每 个 频率 分 配给 NV 个 节点 中 的 一 个 。 因 此 FDM 在 单个 较 大 的 届 
bps 信道 中 创建 了 N 个 较 小 的 RAN bps 信道 。FDM 也 有 TDM 同样 的 优点 和 缺点 。 它 避 
免 了 碰撞 ， 在 N 个 节点 之 间 公 平地 划分 了 市 宽 。 然 而 ，FDM 也 有 TDM 所 具有 的 主要 缺 
点 ， 也 就 是 限制 一 个 节点 只 能 使 用 RAN 的 带宽 ， 即 使 当 它 是 唯一 一 个 有 分 组 要 发 送 的 
节点 时 。 

第 三 种 信道 划分 协议 是 码 分 多 址 (Code Division Multiple Access, CDMA), TDM 和 
FDM 分 别 为 节点 分 配 时 附和 频率 ， 而 CDMA 对 每 个 节点 分 配 一 种 不 同 的 编码 。 然 后 每 个 
节点 用 它 唯一 的 编码 来 对 它 发 送 的 数据 进行 编码 。 如 果 精 心 选择 这 些 编码 ，CDMA 网 络 具 
有 一 种 奇妙 的 特性 ， 即 不 同 的 节点 能 够 同时 传输 ， 并 且 它 们 各 自 相应 的 接收 方 仍 能 正确 接 
收发 送 方 编码 的 数据 比特 (假设 接收 方 知道 发 送 方 的 编码 ) ， 而 不 在 乎 其 他 节点 的 干扰 传 
o CDMA 已 经 在 军用 系统 中 使 用 了 一 段 时 间 (由 于 它 的 抗 干扰 特性 ) ， 目 前 已 经 广泛 地 
用 于 民用 ， 尤 其 是 蜂窝 电话 中 。 因 为 CDMA 的 使 用 与 无 线 信道 紧密 相关 ， 所 以 我 们 将 把 有 
K CDMA 技术 细节 的 讨论 留 到 第 7 章 。 此 时 ， 我 们 知道 CDMA 编码 类 似 于 TDM 中 的 时 际 
和 FDM 中 的 频率 ， 能 分 配给 多 路 访问 信道 的 用 户 就 可 以 了 。 


6. 3.2 随机 接 入 协议 


第 二 大 类 多 访问 协议 是 随机 接 人 协议 。 在 随机 接 人 协议 中 ， 一 个 传输 节点 总 是 以 信 
道 的 全 部 速率 (EIR bps) 进行 发 送 。 当 有 碰撞 时 ， 涉 及 碰撞 的 每 个 节点 反复 地 重 发 它 
的 帧 〈 也 就 是 分 组 ) ， 到 该 帧 无 碰撞 地 通过 为 止 。 但 是 当 一 个 节点 经 历 一 次 碰撞 时 ， 它 
不 必 立 刻 重 发 该 帧 。 相 反 ， 它 在 重 发 该 帧 之 前 等 待 一 个 随机 时 延 。 涉 及 碰撞 的 每 个 节点 
独立 地 选择 随机 时 延 。 因 为 该 随机 时 延 是 独立 地 选择 的 ， 所 以 下 述 现象 是 有 可 能 的 : 这 
些 节点 之 一 所 选择 的 时 延 充 分 小 于 其 他 碰撞 节点 的 时 延 ， 并 因此 能 够 无 碰撞 地 将 它 的 帧 
在 信道 中 发 出 。 

文献 中 描述 的 随机 接 入 协议 即使 没有 上 百 种 也 有 几 十 种 [Rom 1990; Bertsekas 
1991 ]。 在 本 市 中 ,我 们 将 描述 一 些 最 常用 的 随机 接 入 协议 ， 即 ALOHA 协议 [ Abramson 
1970; Abramson 1985; Abramson 2009] 和 载波 侦 听 多 路 访问 (CSMA) 协议 [ Kleinrock 
1975b | 。 以 太 网 | Metcalfe 1976] 是 一 种 流行 并 广泛 部 署 的 CSMA 协议 。 

1. WHR ALOHA 


我 们 以 最 简单 的 随机 接 入 协议 之 一 一 一 时 际 ALOHA 协议 ， 开 始 我 们 对 随机 接 入 协议 
的 学 习 。 在 对 时 际 ALOHA 的 描述 中 ， 我 们 做 下 列 假设 : 

。 AWH L 比特 组 成 。 
时 间 被 划分 成 长 度 为 L/R 秒 的 时 际 (这 就 是 说 ,一 个 时 际 等 于 传输 一 帧 的 时 间 )。 
节点 只 在 时 际 起 点 开始 传输 帧 。 
节点 是 同步 的 ， 每 个 节点 都 知道 时 际 何 时 开始 。 
如 果 在 一 个 时 际 中 有 两 个 或 者 更 多 个 帧 碰撞 ， 则 所 有 节点 在 该 时 际 结束 之 前 检测 
到 该 碰撞 事件 。 

令 p 是 一 个 概率 ， 即 一 个 在 0 和 1 之 间 的 数 。 在 每 个 节点 中 ， 时 际 ALOHA 的 操作 是 
简单 的 : 

e 当 节 点 有 一 个 新 帧 要 发 送 时 ， 它 等 到 下 一 个 时 隙 开始 并 在 该 时 隙 传输 整个 帧 。 

。 如 果 没 有 碰撞 ， 该 节点 成 功 地 传输 它 的 帧 ， 从 而 不 需要 考虑 重 传 该 帧 。( 如 果 该 节 


点 有 新 帧 ， 它 能 够 为 传输 准备 一 个 新 帧 。) 
e 如 果 有 碰撞 ， 该 节点 在 时 际 结束 之 前 检测 到 这 次 碰撞 。 该 节点 以 概率 p 在 后 续 的 
每 个 时 隙 中 重 传 它 的 帧 ， 直 到 该 帧 被 无 碰撞 地 传输 出 去 。 
我 们 说 以 概率 六 重 传 ， 是 指 某 节 点 有 效 地 投掷 一 个 有 偏 倚 的 硬币 ; 硬币 正面 事件 对 
应 着 重 传 ， 而 重 传 出 现 的 概率 为 p。 人 硬币 反面 事件 对 应 着 “ 跳 过 这 个 时 际 ， 在 下 个 时 际 
再 掷 硬币 ; 这 个 事件 以 概率 (1 -p) 出 现 。 所 有 涉及 碰撞 的 节点 独立 地 投掷 它们 的 
硬币 。 

AY BR ALOHA 看 起 来 有 很 多 优点 。 与 信道 划分 不 同 ， 当 某 节 点 是 唯一 活跃 的 节点 时 
(一 个 节点 如 果 有 帧 要 发 送 就 认为 它 是 活跃 的 ) ABR ALOHA 允许 该 节点 以 全 速 R 连续 传 
输 。 时 院 ALOHA 也 是 高 度 分 散 的 ， 因 为 每 个 节点 检测 碰撞 并 独立 地 决定 什么 时 候 重 传 。 
(然而 ， 时 际 ALOHA 的 确 需 要 在 节点 中 对 时 际 同步 ; 我 们 很 快 将 讨论 ALOHA 协议 的 一 个 
不 分 时 隙 的 版 本 以 及 CSMA 协议 ， 这 两 种 协议 都 不 需要 这 种 同步 。) AY BRE ALOHA 也 是 一 
个 极为 简单 的 协议 。 

当 只 有 一 个 活跃 节点 时 ， 时 隙 ALOHA 工作 出 色 , 但 是 当 有 多 个 活跃 节点 时 效率 又 将 
如 何 呢 ? 这 里 有 两 个 可 能 要 考虑 的 效率 问题 。 首 先 ， 如 在 图 6- 10 中 所 示 ， 当 有 多 个 活跃 
节点 时 ， 一 部 分 时 隙 将 有 碰撞 ， 因 此 将 被 “浪费 ” 掉 了 。 第 二 个 考虑 是 ， 时 隙 的 另 一 部 分 
将 是 空闲 的 ， 因 为 所 有 活路 节点 由 于 概率 传输 策略 会 节制 传输 。 唯 一 “未 浪费 的 ”时 陀 是 
那些 刚好 有 一 个 节点 传输 的 时 隙 。 刚 好 有 一 个 节点 传输 的 时 隆 称 为 一 个 成 功 时 隐 (suc- 
cessful slot) 。 时 院 多 路 访问 协议 的 效率 (efficiency) 定义 为 : 当 有 大 量 的 活跃 节点 且 每 个 
节点 总 有 大 量 的 帧 要 发 送 时 ， 长 期 运行 中 成 功 时 际 的 份额 。 注 意 到 如 果 不 使 用 某 种 形式 的 
访问 控制 ， 而 且 每 个 节点 都 在 每 次 碰撞 之 后 立即 重 传 ， 这 个 效率 将 为 零 。 时 际 ALOHA 显 
然 增 加 了 它 的 效率 ， 使 之 大 于 零 ， 但 是 效率 增加 了 多 少 呢 ? 
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图 6-10 节点 1、2 和 3 在 第 一 个 时 际 碰撞 。 节 点 2 最 终 在 第 4 AAR 
成 功 ， 节 点 1 在 第 8 个 时 际 成 功 ， 节 点 3 在 第 9 个 时 院 成 功 


现在 我 们 继续 概要 讨论 时 际 ALOHA 最 大 效率 的 推导 过 程 。 为 了 保持 该 推导 简单， 我 
们 对 协议 做 了 一 点 修改 ,假设 每 个 节点 试图 在 每 个 时 隙 以 概率 p 传输 一 帧 。 (这 就 是 说 ， 
我 们 假设 每 个 节点 总 有 帧 要 发 送 ， 而 且 节 点 对 新 帧 和 已 经 经 历 一 次 碰撞 的 帧 都 以 概率 p 传 
输 。) 假设 及 个 节点 。 则 一 个 给 定时 际 是 成 功 时 隙 的 概率 为 节点 之 一 传输 而 余下 的 NN-1 
个 节点 不 传输 的 概率 。 一 个 给 定 节点 传输 的 概率 是 p; 剩余 节点 不 传输 的 概率 是 (1 - 
Pp) “”。 因 此 ， 一 个 给 定 节点 成 功 传送 的 概率 是 P(1 - p) 。 因 为 有 NN 个 节点 ,任意 一 
节点 成 功 传送 的 概率 是 Np(1 -P) o 
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Auk, “AN 个 活跃 节点 时 ， 时 隙 ALOHA 的 效率 是 Np(1 - p) o AT REN 
个 活跃 节点 的 最 大 效率 ,我 们 必须 求 出 使 这 个 表达 式 最 大 化 的 p”。( 对 这 个 推导 的 一 
个 大 体 描 述 参 见 课 后 习题 ,) 而 且 对 于 大 量 活 跃 节 点， 为 了 获得 最 大 效率 ， 当 WN 趋 于 
无 穷 时 ,我 们 取 Np’ (1 - p" ) ”的 极限 。( 同样 参见 课 后 习题 。) 在 完成 这 些 计算 之 
后 ,我 们 会 发 现 这 个 协议 的 最 大 效率 为 1/e =0.37。 这 就 是 说 ， 当 有 大 量 节点 有 很 多 
帧 要 传输 时 ， 则 (最多) MA 37% 的 时 际 做 有 用 的 工作 。 因 此 该 信道 有 效 传输 速率 
不 是 RRbps， 而 仅 为 0.37R bps! 相似 的 分 析 还 表明 37% 的 时 际 是 空 闪 的 ，26% 的 时 
辽 有 碰撞 。 试 想 一 个 灼 脚 的 网 络 管理 员 购 严 了 一 个 100Mbps AY AY BRE ALOHA AB, Ar 
望 能 够 使 用 网 络 在 大 量 的 用 户 之 间 以 总 计 速 率 如 80Mbps 来 传输 数据 。 尽 管 这 个 信道 
能 够 以 信道 的 全 速 100Mbps 传输 一 个 给 定 的 帧 ,但 从 长 时 间 范 围 看 ， 该 信道 的 成 功 否 
吐 量 将 小 于 37Mbps。 

2. ALOHA 


Af BRE ALOHA 协议 要 求 所 有 的 节点 同步 它们 的 传输 ， 以 在 每 个 时 际 开始 时 开始 传输 。 
第 一 个 ALOHA 协议 [Abramson 1970] 实际 上 是 一 个 非 时 际 、 完 全 分 散 的 协议 。 在 纯 
ALOHA 中 ， 当 一 帧 首次 到 达 〈 即 一 个 网 络 层 数据 报 在 发 送 节点 从 网 络 层 传递 下 来 ) ， 节 点 
立刻 将 该 帧 完整 地 传输 进 广播 信道 。 如 果 一 个 传输 的 帧 与 一 个 或 多 个 传输 经 历 了 碰撞 ， 这 
个 节点 将 立即 (在 完全 传输 完 它 的 碰撞 帧 之 后 ) 以 概率 疡 重 传 该 帧 。 否 则 ， 该 节点 等 竺 一 
个 帧 传输 时 间 。 在 此 等 待 之 后 ， 它 则 以 概率 p 传输 该 帧 ， 或 者 以 概率 1 -p 在 另 一 个 帧 时 
间 等 待 〈 保 持 空 闲 ) 。 

为 了 确定 纯 ALOHA 的 最 大 效率 ， 我们 关注 某 个 单独 的 节点 。 我 们 的 假设 与 在 时 际 
ALOHA 分 析 中 所 做 的 相同 ， 取 帧 传输 时 间 为 时 间 单 元 。 在 任何 给 定时 间 ， 某 节点 传输 一 
个 帧 的 概率 是 p。 假 设 该 帧 在 时 刻 t。 开始 传输 。 如 图 6-11 中 所 示 ， 为 了 使 该 帧 能 成 功 地 传 
输 ， 在 时 间 间 隔 [ie -1，i] 中 不 能 有 其 他 节点 开始 传输 。 这 种 传输 将 与 节点 i 的 帧 传输 
起 始 部 分 相 重 倒 。 所 有 其 他 节点 在 这 个 时 间 间 隔 不 开始 传输 的 概率 是 (1 - p) 。 类 似 
地 ， 当 节点 i 在 传输 时 ， 其 他 节点 不 能 开始 传输 ， 因 为 这 种 传输 将 与 节点 i 传输 的 后 面部 
分 相 重 全 。 所 有 其 他 节点 在 这 个 时 间 间 隔 不 开始 传输 的 概率 也 是 (1 - p)"” 。 因 此 , 一 个 
给 定 的 节点 成 功 传输 一 次 的 概率 是 p(1 -pOT ” 。 通 过 与 时 隙 ALOHA 情况 一 样 来 取 极 
限 ， 我 们 求 得 纯 ALOHA 协议 的 最 大 效率 仅 为 1/(2e)， 这 刚好 是 时 际 ALOHA 的 一 半 。 这 
就 是 完全 分 散 的 ALOHA 协议 所 要 付出 的 代价 。 


将 与 节点 i 的 将 与 节点 i 的 
帧 开始 部 分 重 悉 WAT RB) RE 


| | 
| | 
l | 
| | 
| | 
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to t+1 


图 6-11 纯 ALOHA 中 的 干扰 传输 
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Norm Abramson 和 ALOHAnet | 


Norm Abramson 是 一 名 有 博士 学 位 的 工程 师 ， 对 冲浪 运动 很 有 激情 ， 而 且 对 分 组 交换 | 
很 感 兴趣 。 这 些 兴趣 的 结合 使 他 在 1969 年 到 了 夏威夷 大 学 。 夏 威 夷 是 由 许多 巨大 的 岛屿 
组 成 的 ， 安 装 和 运营 基于 陆地 的 网 络 是 困难 的 。 当 不 冲浪 的 时 候 ，Abramson 思考 如 何 设计 | 
一 种 在 无 线 信道 上 完成 分 组 交互 的 网 络 。 他 设计 的 网 络 有 一 个 中 心 主机 和 几 个 分 散在 夏 威 | 
夷 各 个 岛 上 的 二 级 节点 。 该 网 络 有 两 个 信道 ， 每 个 信道 使 用 不 同 的 频段 。 下 行 链 路 信道 从 
中 心 主机 向 二 级 主机 广播 分 组 ; 上 行 信道 从 二 级 主机 向 中 心 主机 发 送 分 组 。 除 了 发 送信 息 
分 组 ， 中 心 主机 还 在 下 行 信道 上 对 从 二 级 主机 成 功 接收 到 的 每 个 分 组 发 送 确 认 。 

因为 二 级 主机 以 分 散 的 方式 传输 分 组 ， 在 上 行 信 道上 出 现 碰 撞 是 不 可 避免 的 。 这 个 观 
察 导 致 Abramson 设计 了 如 本 章 所 描述 的 那 种 纯 ALOHA 协议 。 在 1970 年 ， 通 过 不 断 从 | 
ARPA 获得 的 资助 ，Abramson 将 他 的 ALOHAnet 与 ARPAnet 相连 。Abramson 的 工作 是 很 重 
要 的 ， 不 仅 因 为 它 是 无 线 分 组 网 络 的 第 一 个 例子 ， 而 且 因 为 它 激励 了 Bob Metcalfe, LE | 
ZI, Metcalfe 修改 了 ALOHA 协议 ,创造 了 CSMA/CD 协议 和 以 太 网 局 域 网 。 








3. 载波 侦 听 多 路 访问 (CSMA) 


在 时 际 和 纯 ALOHA 中 ， 一 个 节点 传输 的 决定 独立 于 连接 到 这 个 广播 信道 上 的 其 他 节 
点 的 活动 。 特 别 是 ， 一 个 节点 不 关心 在 它 开 始 传输 时 是 否 有 其 他 节点 碰巧 在 传输 ， 而 且 即 
使 有 另 一 个 节点 开始 干扰 它 的 传输 也 不 会 停止 传输 。 在 我 们 的 鸡尾酒 会 类 比 中 ，ALOHA 
协议 非常 像 一 个 粗野 的 聚会 客人 ， 他 喉 唆 不 体 地 讲话 而 不 顾 是 否 其 他 人 在 说 话 。 作 为 人 
类 ， 我 们 有 人 类 的 协议 ， 它 要 求 我 们 不 仅 要 更 为 礼 狐 ， 而 且 在 谈话 中 要 减少 与 他 人 “ 碰 
撞 ” 的 时 间 ， 从 而 增加 我 们 谈话 中 交流 的 数据 量 。 具 体 而 言 ， 有 礼貌 的 人 类 谈话 有 两 个 重 
要 的 规则 : 

e 说 话 之 前 先 听 。 如 果 其 他 人 正在 说 话 ， 等 到 他 们 说 完 话 为 止 。 在 网 络 领 域 中 ， 这 

被 称 为 载波 侦 听 (carrier sensing) ， 即 一 个 节点 在 传输 前 先 听 信道 。 如 果 来 自 另 一 
个 节点 的 帧 正身 信道 上 发 送 ， 节 点 则 等 待 直到 检测 到 一 小 段 时 间 没 有 传输 ， 然 后 
开始 传输 。 

© 如 果 与 他 人 同时 开始 说 话 ， 停 止 说 话 。 在 网 络 领域 中 ， 这 被 称 为 碰撞 检测 (colli- 

sion detection) ， 即 当 一 个 传输 节点 在 传输 时 一 直 在 侦 听 此 信道 。 如 果 它 检测 到 另 
一 个 节点 正在 传输 干扰 帧 ， 它 就 停止 传输 ， 在 重复 “ 侦 听 - 当空 闲 时 传输 ”循环 
之 前 等 竺 一段 随 机 时 间 。 

这 两 个 规则 包含 在 载波 侦 听 多 路 访问 (Carrier Sense Multiple Access, CSMA) 和 具有 
碰撞 检测 的 CSMA (CSMA with Collision Detection, CSMA/CD) 协议 族 中 [ Kleinrock 
1975b; Metcalfe 1976; Lam 1980; Rom 1990 ] 。 人 们 已 经 提出 了 CSMA 和 CSMA/CD 的 许 
多 变种 。 这 里 ， 我 们 将 考虑 一 些 CSMA 和 CSMA/CD 最 重要 的 和 基本 的 特性 。 

关于 CSMA 你 可 能 要 问 的 第 一 个 问题 是 ， 如 果 所 有 的 节点 都 进行 载波 侦 听 了 ， 为 什么 
当初 会 发 生 碰撞 ? 毕竟 ， 某 节点 无 论 何 时 侦 听 到 另 一 个 节点 在 传输 ， 它 都 会 停止 传输 。 对 
于 这 个 问题 的 答案 最 好 能 够 用 时 空 图 来 说 明 [ Molle 1987], K 6-12 显示 了 连接 到 一 个 线 
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状 广播 总 线 的 4 个 节点 (AL B, C, D) 的 时 空 图 。 横 轴 表 示 每 个 节点 在 空间 的 位 置 ; 纵 
轴 表 示 时 间 。 

在 时 刻 to, WA B 侦 听 到 信道 是 空闲 的 ， 因 为 当前 没有 其 他 节点 在 传输 。 因 此 节点 也 
开始 传输 ， 沿 着 广播 媒体 在 两 个 方向 上 传播 它 的 比特 。 图 6-12 中 了 的 比特 随 着 时 间 的 增 
加 向 下 传播 ， 这 表明 B 的 比特 沿 着 广播 媒体 传播 所 实际 需要 的 时 间 不 是 零 (虽然 以 接近 光 
的 速度 )。 在 时 刻 4 (1t，> i。)， 节 点 D 有 一 个 帧 要 发 送 。 尽 管 节点 B 在 时 刻 记 正在 传输 ， 
但 B 传输 的 比特 还 没有 到 达 D， 因 此 D Æ t 侦 听 到 信道 空闲 。 根 据 CSMA 协议 ， 从 而 D F 
始 传输 它 的 帧 。 一 个 短暂 的 时 间 之 后 ，B 的 传输 开始 在 D 干扰 D 的 传输 。 从 图 6-12 中 可 
以 看 出 ， 显 然 广播 信道 的 端 到 端 信道 传播 时 延 (channel propagation delay) (信和 号 从 一 个 节 
点 传播 到 另 一 个 节点 所 花费 的 时 间 ) 在 决定 其 性 能 方面 起 着 关键 的 作用 。 该 传播 时 延 越 
长 ， 载 波 侦 听 节 点 不 能 侦 听 到 网 络 中 男 一 个 节点 已 经 开始 传输 的 机 会 就 越 大 。 

4. 具有 磁 樟 检测 的 载波 侦 听 多 路 访问 (CSMA/CD) 

在 图 6-12 中 ， 节 点 没有 进行 碰撞 检测 ; 即使 已 经 出 现 了 碰撞 ，B 和 D 都 将 继续 完整 
地 传输 它们 的 帧 。 当 某 节 点 执行 碰撞 检测 时 ， 一 旦 它 检测 到 碰撞 将 立即 停止 传输 。 图 6-13 
表示 了 和 图 6-12 相同 的 情况 ， 只 是 这 两 个 节点 在 检测 到 碰撞 后 很 短 的 时 间 内 都 放弃 了 它 
们 的 传输 。 显 然 ， 在 多 路 访问 协议 中 加 入 碰撞 检测 ， 通 过 不 传输 一 个 无 用 的 、( 由 来 自 另 
一 个 节点 的 帧 干扰 ) 损坏 的 帧 ， 将 有 助 于 改善 协议 的 性 能 。 








碰撞 检测 / 艇 弃 时 间 “| 





时 间 时 间 。 ”时间 时 间 
图 6-12 ”发 生 碰撞 传输 的 两 个 CSMA 节点 的 时 空 图 图 6-13 具有 碰撞 检测 的 CSMA 


在 分 析 CSMA/CD 协议 之 前 ， 我 们 现在 从 与 广播 信道 相连 的 适配器 〈 在 节点 中 ) 的 角 
度 总 结 它 的 运行 : 

1) 适配器 从 网 络 层 一 条 获得 数据 报 ， 准 备 链 路 层 帧 ， 并 将 其 放 入 帧 适 配 融 缓存 中 。 

2) 如 果 适 配器 侦 听 到 信道 空闲 〈 即 无 信号 能 量 从 信道 进入 适配器 ) ， 它 开始 传输 帧 。 
在 另 一 方面 ， 如 果 适 配 需 侦 听 到 信道 正在 忙 ， 它 将 等 待 ， 直 到 侦 听 到 没有 信号 能 量 时 才 开 
始 传输 帧 。 

3) 在 传输 过 程 中 ， 适 配 带 监视 来 自 其 他 使 用 该 广播 信道 的 适 配 融 的 信号 能 量 的 存在 。 
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了 该 帧 。 在 另 一 方面 ， 如 果 适 配器 在 传输 时 检测 到 来 自 其 他 适配器 的 信号 能 量 ， 它 中 止 传 
输 〈( 即 它 停 止 了 传输 帧 ) 。 

5) 中 止 传输 后 ， 适 配器 等 待 一 个 随机 时 间 量 ， 然 后 返回 步骤 2。 

等 待 一 个 随机 (而 不 是 固定 ) 的 时 间 量 的 需求 是 明确 的 一 一 如 果 两 个 节点 同时 传输 
帧 ， 然 后 这 两 个 节点 等 待 相同 固定 的 时 间 量 ,， 它们 将 持续 碰撞 下 去 。 但 选择 随机 回 退 时 间 
的 时 间 间 隔 多 大 为 好 呢 ? 如 果 时 间 间 隔 大 而 碰撞 节点 数量 小 ， 在 重复 “ 侦 听 - 当空 闲 时 传 
输 ” 的 步骤 前 ， 节 点 很 可 能 等 待 较 长 的 时 间 (使 信道 保持 空闲 ) 。 在 另 一 方面 ， 如 果 时 间 
间隔 小 而 碰撞 节点 数量 大 ， 很 可 能 选择 的 随机 值 将 几乎 相同 ,传输 节点 将 再 次 碰撞 。 我 们 
希望 时 间 间 隔 应 该 这 样 : 当 碰 撞 节 点 数量 较 少 时 ， 时 间 间 隔 较 短 ; 当 碰 撞 节 点 数量 较 大 
时 ， 时 间 间 隔 较 长 。 

用 于 以 太 网 以 及 DOCSIS 电缆 网 络 多 路 访问 协议 [ DOCSIS 2011) 中 的 二 进 制 指数 后 
退 (binary exponential backoff) 算法 ， 简练 地 解决 了 这 个 问题 。 特 别 是 ， 当 传输 一 个 给 定 
帧 时 ， 在 该 帧 经 历 了 一 连 串 的 次 碰撞 后 ， 节 点 随机 地 从 10，1，2,… ，2” -1| 中 选择 
一 个 开 值 。 因 此 ， 一 个 帧 经 历 的 碰撞 越 多 , 天 选择 的 间 隅 越 大 。 对 于 以 太 网 ， 一 个 节点 等 
待 的 实际 时 间 量 是 K: 512 比特 时 间 ( 即 发 送 512 比特 进入 以 太 网 所 需 时 间 量 的 天 倍 ) n 
能 够 取 的 最 大 值 在 10 以 内 。 

我 们 看 一 个 例子 。 假 设 一 个 适配器 首次 尝试 传输 一 个 帧 ， 并 在 传输 中 它 检 测 到 碰撞 。 
然后 该 节点 以 概率 0. 5 选择 下 =0， 以 概率 0. 5 选择 下 =1。 如 果 该 节点 选择 下 =0， 则 它 立 
即 开始 侦 听 信道 。 如 果 这 个 适配器 选择 K=1， 它 在 开始 “ 侦 听 - 当空 闲 时 传输 ” 。 周 期 前 
等 待 512 比特 时 间 (例如 对 于 100Mbps 以 太 网 来 说 为 5. 12ms ) 。 在 第 2 次 碰撞 之 后 ， 从 
10, 1, 2, 3| 中 等 概率 地 选择 K。 在 第 3 次 碰撞 之 后 , 从 i0, 1, 2, 3, 4, 5, 6, 7| 
中 等 概率 地 选择 天 。 在 10 次 或 更 多 次 碰撞 之 后 ， 从 10，1 ，2，…，1023| 中 等 概率 地 选 
择 K。 因 此 从 中 选择 的 集合 长 度 随 着 碰撞 次 数 呈 指数 增长 ; 正 是 由 于 这 个 原因 ， 该 算法 
被 称 为 二 进 制 指数 后 退 。 

这 里 我 们 还 要 注意 到 ， 每 次 适配器 准备 传输 一 个 新 的 帧 时 ， 它 要 运行 CSMA/CD 算 
法 。 不 考虑 近期 过 去 的 时 间 内 可 能 已 经 发 生 的 任何 碰撞 。 因 此 ， 当 几 个 其 他 适配器 处 于 指 
数 后 退 状态 时 ， 有 可 能 一 个 具有 新 帧 的 节点 能 够 立刻 插入 一 次 成 功 的 传输 。 

5. CSMA/CD 效率 


当 只 有 一 个 节点 有 一 个 帧 发 送 时 ,该 节点 能 够 以 信道 全 速率 进行 传输 (例如 10Mbps、 
100Mbps 或 者 1Gbps)。 然 而 ， 如 果 很 多 节点 都 有 帧 要 发 送 ， 信 道 的 有 效 传输 速率 可 能 会 小 
得 多 。 我 们 将 CSMA/CD 效率 〈efficiency of CSMA/CD) 定义 为 : 当 有 大 量 的 活跃 市 点 ， 
上 且 每 个 节点 有 大 量 的 帧 要 发 送 时 ， 帧 在 信道 中 无 碰撞 地 传输 的 那 部 分 时 间 在 长 期 运行 时 间 
中 所 占 的 份额 。 为 了 给 出 效率 的 一 个 闭 式 的 近似 表示 ， 令 dw 表示 信号 能 量 在 任意 两 个 适 
配器 之 间 传 播 所 需 的 最 大 时 间 。 令 di 表示 传输 一 个 最 大 长 度 的 以 太 网 帧 的 时 间 (对 于 
10Mbps 的 以 太 网 ， 该 时 间 近 似 为 1.2 RD). CSMA/CD 效率 的 推导 超出 了 本 书 的 范围 
(JL [Lam 1980] 和 [Bertsekas 1991 ] ) 。 这 里 我 们 只 是 列 出 下 面 的 近似 式 : 


ae. l 
效率 = Ld 


从 这 个 公式 我 们 看 到 ， 当 drop 接近 0 时 ,效率 接近 1。 这 和 我 们 的 直觉 相符 ， 如 果 传 
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播 时 延 是 0， 磁 撞 的 节点 将 立即 中 止 而 不 会 浪费 信道 。 同 时 ， 当 duen 变 得 很 大 时 ， 效 率 也 
接近 于 1。 这 也 和 直 沉 相符， 因为 当 一 个 帧 取得 了 信道 时 ， 它 将 占有 信道 很 长 时 间 ; 因此 
信道 在 大 多 数 时 间 都 会 有 效 地 工作 。 


6. 3.3 轮流 协议 


前 面 讲 过 多 路 访问 协议 的 两 个 理想 特性 是 : Q 当 只 有 一 个 节点 活路 时， 该 活跃 节点 具 
AR bps 的 吞吐 量 ; Q4AM 个 节点 活跃 时 ， 每 个 活跃 节点 的 吞吐 量 接近 R/M bps。ALO- 
HA 和 CSMA 协议 具备 第 一 个 特性 ， 但 不 具备 第 二 个 特性 。 这 激发 研究 人 员 创 造 另 一 类 协 
议 ， 也 就 是 轮流 协议 (taking-turns protocol) 。 和 随机 接 人 协议 一 样 ， 有 几 十 种 轮流 协议 ， 
其 中 每 一 个 协议 又 都 有 很 多 变种 。 这 里 我 们 要 讨论 两 种 比较 重要 的 协议 。 第 一 种 是 轮 询 协 
i (polling protocol) 。 轮 询 协 议 要 求 这 些 节 点 之 一 要 被 指定 为 主 节 点 。 主 节点 以 循环 的 方 
式 轮 询 (poll) 每 个 节点 。 特 别 是 ， 主 节点 首先 向 节点 1 发 送 一 个 报 文 ， 告 诉 它 〈 节 点 1) 
能 够 传输 的 帧 的 最 多 数量 。 在 节点 1 传输 了 某 些 帧 后 ， 主 节点 告诉 节点 2 它 (节点 2) 能 
够 传输 的 帧 的 最 多 数量 。( 主 节点 能 够 通过 观察 在 信道 上 是 否 缺 乏 信 号 ， 来 决定 一 个 节点 
何 时 完成 了 帧 的 发 送 。) 上 述 过 程 以 这 种 方式 继续 进行 ， 主 节点 以 循环 的 方式 轮 询 了 每 个 
Tiaa 

FO AOA GR SPADE BL A N AREER, ES AA ES E, 
但 是 它 也 有 一 些 缺 点 。 第 一 个 缺点 是 该 协议 引入 了 轮 询 时 延 ， 即 通知 一 个 节点 “ 它 可 以 传 
午 ” 所 需 的 时 间 。 例 如 ， 如 果 只 有 一 个 节点 是 活路 的， 那么 这 个 节点 将 以 小 于 R bps 的 速 
率 传输 ， 因 为 每 次 活跃 节点 发 送 了 它 最 多 数量 的 帧 时 ， 主 节点 必须 依次 轮 询 每 一 个 非 活 路 
的 节点 。 第 二 个 缺点 可 能 更 为 严重 ， 就 是 如 果 主 节点 有 故障 ， 整 个 信道 都 变 得 不 可 操作 。 
我 们 在 本 节 学 习 的 802. 15 协议 和 蓝牙 协议 就 是 轮 询 协议 的 例子 。 

第 二 种 轮流 协议 是 令 牌 传递 协议 (token-passing protocol) 。 在 这 种 协议 中 没有 主 节点 。 
一 个 称 为 令 牌 (token) 的 小 的 特殊 帧 在 节点 之 间 以 某 种 固定 的 次 序 进行 交换 。 例 如 ， 节 
点 1 可 能 总 是 把 令 牌 发 送 给 节点 2， 节 点 2 可 能 总 是 把 令 牌 发 送 给 节点 3， 而 节点 入 可 能 
总 是 把 令 牌 发 送 给 节点 1。 当 一 个 节点 收 到 令 牌 时 ， 仅 当 它 有 一 些 帧 要 发 送 时 ， 它 才 持 有 
这 个 令 牌 ; 否则 ， 它 立即 向 下 一 个 节点 转发 该 令 牌 。 当 一 个 节点 收 到 令 牌 时 ， 如 果 它 确实 
有 帧 要 传输 ， 它 发 送 最 大 数目 的 帧 数 ， 然 后 把 令 牌 转发 给 下 一 个 节点 。 令 牌 传递 是 分 散 
的 ， 并 有 很 高 的 效率 。 但 是 它 也 有 自己 的 一 些 问题 。 例 如 ， 一 个 节点 的 故障 可 能 会 使 整个 
言 道 朋 演 。 或 者 如 果 一 个 节点 偶然 忘记 了 释放 令 牌 ， 则 必须 调用 某 些 恢 复 步 又 使 令 牌 返回 
到 循环 中 来 。 经 过 多 年 ， 人 们 已 经 开发 了 许多 令 牌 传递 协议 ， 包 括 光 纤 分 布 式 数据 接口 
(FDDI) 协 议 [ Jain 1994] Fi IEEE 802.5 今 牌 环 协议 [IEEE 802.5 2012 | ， 每 一 种 都 必须 解 
决 这些 和 其 他 一 些 棘 手 的 问题 。 


6.3.4 DOCSIS: 用 于 电缆 因特网 接 入 的 链 路 层 协议 


在 前 面 3 小 节 中 ， 我 们 已 经 学 习 了 3 大 类 多 路 访问 协议 : 信道 划分 协议 、 随 机 接 入 协 
议和 轮流 协议 。 这 里 的 电缆 接 人 网 将 作为 一 种 很 好 的 学 习 案 例 ， 因 为 在 电缆 接 人 网 中 我 们 
将 看 到 这 三 类 多 路 访问 协议 中 的 每 一 种 ! 

1.2.1 节 讲 过 ， 一 个 电缆 接 人 网 通 稼 在 电缆 网 头 端 将 几 千 个 住宅 电缆 调制 解 调 器 与 一 
个 电缆 调制 解 调 器 端 接 系 统 (Cable Modem Termination System, CMTS) 连接 。 数 据 经 电线 
服务 接口 (Data- Over- Cable Service Interface, CMTS) 规范 (DOCSIS) | DOCSIS 2011] 定 
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义 了 电缆 数据 网 络 体系 结构 及 其 协议 。D0OCSIS 使 用 FDM 将 下 行 (CMTS FI) dal sill 4 Dal BF ) 
和 上 行 (调制 解 调 器 到 CMTS) 网 络 段 划分 为 多 个 频率 信道 。 每 个 下 行 信道 宽 6MHz， 每 
个 信道 具有 大 约 40Mbps 吞吐 量 (尽管 这 种 数据 率 在 实践 中 很 少 在 电缆 调制 解 调 器 中 见 
到 ) ; 每 个 上 行 信道 具有 6.4MHz 的 最 大 信道 带宽 ， 并且 最 大 的 上 行 吞 吐 量 约 为 30Mbps。 
每 个 上 行 和 下 行 信道 均 为 广播 信道 。CMTS 在 下 行 信 道中 传输 的 帧 被 所 有 在 信道 上 做 接收 
的 电缆 调制 解 调 器 接收 到 ; 然而 因为 仅 有 单一 的 CMTS 在 下 行 信道 上 传输 ， 不 存在 多 路 访 
问 问题 。 但 在 上 行 方 向 ， 存 在 着 多 个 有 趣 的 技术 挑战 ， 因 为 多 个 电缆 调制 解 调 器 共享 到 
CMTS 的 相同 上 行 信 道 (频率 )， 因 此 能 够 潜在 地 出 现 碰撞 。 

如 图 6-14 所 示 ， 每 条 上 行 信道 被 划分 为 时 间 间 隔 〈 类 似 于 TDM) ， 每 个 时 间 间 隔 包 含 
一 个 微 时 隙 序列 ， 电 缆 调 制 解 调 器 可 在 该 微 时 隙 中 向 CMTS 传输 。CMTS 显 式 地 准许 各 个 
电缆 调制 解 调 器 在 特定 的 微 时 隙 中 进 行 传输 。CMTS 在 下 行 信 道上 通过 发 送 称 为 MAP 报 文 
的 控制 报 文 ， 指 定 哪个 电缆 调制 解 调 器 〈 带 有 要 发 送 的 数据 ) 能 够 在 微 时 际 中 传输 由 控制 
报 文 指定 的 时 间 间 隔 。 由 于 微 时 院 明 确 分 配给 电缆 调制 解 调 器 ， 故 CMTS 能 够 确保 在 微 时 


际 中 没有 碰撞 传输 。 
4] 的 MAP 帧 
Pa | 下 行 信道; 
6 G 
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图 6-14 CMTS 和 电缆 调制 解 调 器 之 间 的 上 行 和 下 行 信道 


但 是 CMTS 一 开始 是 如 何 知道 哪个 电缆 调制 解 调 器 有 数据 要 发 送 呢 ? 通过 让 电费 调 
制 解 调 器 在 专用 于 此 目的 的 一 组 特殊 的 微 时 隙 间隔 内 向 CMTS 发 送 微 时 际 请 求 帧 来 完成 
该 任务 ， 如 图 6-14 所 示 。 这 些微 时 隙 请 求 帧 以 随机 接 人 方式 传输 ， 故 可 能 相互 碰撞 。 
电缆 调制 解 调 器 既 不 能 侦 听 上 行 信道 是 否 忙 ， 也 不 能 检测 碰撞 。 相 反 ， 该 电缆 调制 解 调 
器 如 果 没 有 在 下 一 个 下 行 控制 报 文中 收 到 对 请 求 分 配 的 响应 的 话 ， 就 推断 出 它 的 微 时 院 
请 求 帧 经 历 了 一 次 碰撞 。 当 推断 出 一 次 碰撞 ， 电 缆 调 制 解 调 需 使 用 二 进 制 指数 回 退 将 其 
微 时 隙 请 求 帧 延缓 到 以 后 的 时 隙 重新 发 送 。 当 在 上 行 信 道上 有 很 少 的 流量 ， 电 缆 调 制 解 
调 器 可 能 在 名 义 上 分 配给 微 时 隙 请 求 帧 的 时 隙 内 实际 传输 数据 帧 (因此 避免 不 得 不 等 待 
微 时 际 分 配 )。 

因此 ， 电 缆 接 入 网 可 作为 应 用 多 路 访问 协议 ( 即 FPM、TDM、 随 机 接 入 和 集中 分 配 
时 际 都 用 于 一 个 网 络 中 ) 的 一 个 极 好 例子 。 


6.4 交换 局 域 网 
前 面 一 节 涉 及 了 广播 网 络 和 多 路 访问 协议 ， 我 们 现在 将 注意 力 转向 交换 局 域 网 。 
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图 6-15 显示 了 一 个 交换 局 域 网 连接 了 3 AR], AERA AAR A 台 交 换 机 连接 的 
路 由 器 。 因 为 这 些 交换 机 运行 在 链 路 层 ， 所 以 它们 交换 链 路 层 帧 〈 而 不 是 网 络 层 数据 报 ) ， 
不 识别 网 络 层 地 址 ， 不 使 用 如 RIP 或 OSPF 这 样 的 路 由 选择 算法 来 确定 通过 第 二 层 交 换 机 
网 络 的 路 径 。 我 们 马上 就 会 看 到 ， 它 们 使 用 链 路 层 地 址 而 不 是 卫 地 址 来 转发 链 路 层 帧 通 
过 交换 机 网 络 。 我 们 首先 以 讨论 链 路 层 寻 址 (6.4.1 节 ) 来 开始 对 交换 机 局 域 网 的 学 习 。 
然后 仔细 学 习 著 名 的 以 太 网 协议 (6.4.2 节 )。 在 仔细 学 习 链 路 层 寻 址 和 以 太 网 后 ,我们 
将 考察 链 路 层 交 换 机 的 工作 方式 (6.4.3 节 )， 并 随后 考察 通常 是 如 何 用 这 些 交 换 机 构建 
大 规模 局 域 网 的 (6. 4.4 市 )。 
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图 6-15 由 4 台 交 换 机 连接 起 来 的 某 机 构 网 络 


6.4.1 链 路 层 寻 址 和 ARP 


主机 和 路 由 器 具有 链 路 层 地 址 。 现 在 你 也 许 会 感到 惊讶 ， 第 4 章 中 不 是 讲 过 主机 和 路 
由 需 也 具有 网 络 层 地 址 吗 ? 你 也 许 会 问 : 为 什么 我 们 在 网 络 层 和 链 路 层 都 需要 地 址 呢 ? BR 
了 描述 链 路 层 地 址 的 语法 和 功能 ， 在 本 节 中 我 们 希望 明明 白白 地 搞 清 楚 两 层 地 址 都 有 用 的 
原因 ， 事实 上 这 些 地 址 是 必 不 可 少 的 。 我 们 还 将 学 习 地 址 解析 协议 (ARP) ， 该 协议 提供 
了 将 UP 地 址 转换 为 链 路 层 地 址 的 机 制 。 

1. MAC 地 址 


事实 上 ， 并 不 是 主机 或 路 由 器 具有 链 路 层 地 址 ， 而 是 它们 的 适配器 〈 即 网 络 接口 ) 具 
有 链 路 层 地 址 。 因 此 ， 具 有 多 个 网 络 接 口 的 主机 或 路 由 器 将 具有 与 之 相关 联 的 多 个 链 路 层 
地 址 ， 就 像 它 也 具有 与 之 相关 联 的 多 个 IP 地 址 一 样 。 然 而 ， 重 要 的 是 注意 到 链 路 层 交 换 
机 并 不 具有 与 它们 的 接口 〈 这 些 接口 是 与 主机 和 路 由 器 相连 的 ) 相关 联 的 链 路 层 地 址 。 这 
是 因为 链 路 层 交 换 机 的 任务 是 在 主机 与 路 由 器 之 间 承 载 数据 报 ; 交换 机 透明 地 执行 该 项 任 
务 ， 这 就 是 说 ， 主 机 或 路 由 器 不 必 明 确 地 将 帧 寻 址 到 其 间 的 交换 机 。 图 6- 16 中 说 明了 这 
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种 情况 。 链 路 层 地 址 有 各 种 不 同 的 称呼 : LAN 地 址 (LAN address ) 、 物 理 地 址 (physical 
address) 或 MAC 地 址 (MAC address) 。 因 为 MAC 地 址 似乎 是 最 为 流行 的 术语 ， 所 以 我 们 
此 后 就 将 链 路 层 地 址 称 为 MAC 地 址 。 对 于 大 多 数 局 域 网 (包括 以 太 网 和 802. 11 无 线 局 域 
网 ) mA, MAC 地 址 长 度 为 6 字 节 ， 共 有 2 ”个 可 能 的 MAC 地 址 。 如 图 6-16 所 示 ， 这 些 6 
个 字 节 地 址 通常 用 十 六 进 制 表示 法 ， 地 址 的 每 个 字 节 被 表示 为 一 对 十 六 进 制 数 。 尽 管 
MAC 地 址 被 设计 为 永久 的 ， 但 用 软件 改变 一 块 适配器 的 MAC 地 址 现在 是 可 能 的 。 然 而 ， 
对 于 本 节 的 后 面部 分 而 言 ， 我 们 将 假设 某 适 配器 的 1A-23-F9-CD-06-9B 

MAC 地 址 是 固定 的 。 

MAC 地 址 的 一 个 有 趣 性 质 是 没有 两 块 适 配 船 具有 
相同 的 地 址 。 考 虑 到 适配器 是 由 许多 不 同 国家 和 地 区 
的 不 同 公司 生 产 的 ， 这 看 起 来 似乎 是 件 神 奇 之 事 。 中 
国 台湾 生产 适 配 需 的 公司 如 何 能 够 保证 与 比利时 生产 
适配器 的 公司 使 用 不 同 的 地 址 呢 ? 答案 是 IEEE 在 管 
理 着 该 MAC 地 址 空间 。 特 别 是 ， 当 一 个 公司 要 生产 
适配器 时 ， 它 支付 象征 性 的 费用 购买 组 成 2” 个 地 址 的 
一 块 地 址 空间 。IEEE 分 配 这 块 2” 个 地 址 的 方式 是 : 
固定 一 个 MAC 地 址 的 前 24 比特 ， 让 公司 目 己 为 每 个 pp 
适配器 生成 后 24 比特 的 唯一 组 合 。 She ene ia 

适配器 的 MAC 地 址 具有 扁平 结构 〈 这 与 层次 
结构 相反 ) ， 而 且 不 论 适 配器 到 哪里 用 都 不 会 变化 。 带 有 以 太 网 接口 的 便携 机 总 具有 同 
样 的 MAC 地 址 ， 无 论 该 计算 机 位 于 何方 。 具 有 802. 11 接口 的 一 台 智 能 手机 总 是 具有 相 
同 的 MAC 地址， 无 论 该 智能 手机 到 哪里 。 与 之 形成 对 照 的 是 ， 前 面 说 过 的 IP 地 址 具有 
层次 结构 〈 即 一 个 网 络 部 分 和 一 个 主机 部 分 ) ， 而 且 当 主机 移动 时 ， 主 机 的 IP 地 址 需要 
改变 ， 即 改变 它 所 连接 到 的 网 络 。 适 配器 的 MAC 地 址 与 人 的 社会 保险 号 相似 ， 后 者 也 
具有 扁平 寻 址 结构 ， 而 且 无 论 人 到 哪里 该 号 码 都 不 会 变化 。IP 地址 则 与 一 个 人 的 邮政 地 
址 相似 ， 它 是 有 层次 的 ， 无 论 何 时 当 人 搬家 时 ， 该 地 址 都 必须 改变 。 就 像 一 个 人 可 能 发 
现 邮 政 地 址 和 社会 保险 号 都 有 用 那样 ， 一 台 主 机 具有 一 个 网 络 层 地 址 和 一 个 MAC 地 址 
是 有 用 的 。 

当 某 适配器 要 问 某 些 目的 适配器 发 送 一 个 帧 时 ， 发 送 适 配器 将 目的 适配器 的 MAC 地 
址 插入 到 该 帧 中 ， 并 将 该 帧 发 送 到 局 域 网 上 。 如 我 们 马上 要 看 到 的 那样 ， 一 台 交 换 机 偶尔 
将 一 个 人 帧 广播 到 它 的 所 有 接口 。 我 们 将 在 第 7 章 中 看 到 802. 11 也 广播 帧 。 因 此 一 块 适 
配器 可 以 接收 一 个 并 非 向 它 寻 址 的 帧 。 这 样 ， 当 适配器 接收 到 一 个 帧 时 ， 将 检查 该 帧 中 的 
目的 MAC 地 址 是 否 与 它 自己 的 MAC 地 址 匹配 。 如 果 匹 配 ， 该 适配器 提取 出 封装 的 数据 
报 ， 并 将 该 数据 报 沿 协议 栈 向 上 传递 。 如 果 不 匹 配 ， 该 适配器 丢弃 该 帧 ， 而 不 会 向 上 传递 
该 网 络 层 数 据 报 。 所 以 ， 仅 当 收 到 该 帧 时 ， 才 会 中 断 目的 地 。 

然而 ， 有 时 某 发 送 适 配 骼 的 确 要 让 局 域 网 上 所 有 其 他 适配器 来 接收 并 处 理 它 打算 发 送 
的 帧 。 在 这 种 情况 下 ， 发 送 适 配器 在 该 帧 的 目的 地 址 字段 中 插入 一 个 特殊 的 MAC 广播 地 
tit (broadcast address ) 。 对 于 使 用 6 字 节 地 址 的 局 域 网 (例如 以 太 网 和 802.11) Ki, 
播 地 址 是 48 个 连续 的 1 组 成 的 字符 串 ( 即 以 十 六 进 制 表示 法 表示 的 FF- FF- FF- FF- FF- 
FF) . 
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主机 和 路 由 器 接口 除了 网 络 层 地 址 之 外 还 有 MAC 地 址 ， 这 有 如 下 几 个 原因 。 首 先 ， 
| 局域网 是 为 任意 网 络 层 协议 而 设计 的 ， 而 不 只 是 用 于 IP 和 因特网 。 如 果 适 配器 被 指派 
| IP 地 址 而 不 是 “中 性 的 ”MAC 地 址 的 话 ， 则 适配器 将 不 能 够 方便 地 支持 其 他 网 络 层 协 
议 ( 例 如，IPX 或 者 DECnet ) 。 其 次 ， 如 果 适 配器 使 用 网 络 层 地 址 而 不 是 MAC 地 址 的 
| 话 ， 网 络 层 地 址 必须 存储 在 适配器 的 RAM 中 ， 并 且 在 每 次 适配器 移动 (或 加 电 ) 时 要 
重新 配置 。 另 一 种 选择 是 在 适配器 中 不 使 用 任何 地 址 ， 让 每 个 适配器 将 它 收 到 的 每 帧 数 
H (通常 是 了 数据 报 ) 沿 协 议 栈 向 上 传递 。 然 后 网 络 层 则 能 够 核对 网 络 地 址 层 是 否 匹 
配 。 这 种 选择 带 来 的 一 个 问题 是 ， 主 机 将 被 局 域 网 上 发 送 的 每 个 帧 中 断 ， 包 括 被 目的 地 
是 在 相同 广播 局 域 网 上 的 其 他 节点 的 帧 中 断 。 总 之 ， 为 了 使 网 络 体系 结构 中 各 层次 成 为 
| 极为 独立 的 构建 模块 ， 不 同 的 层次 需要 有 它们 自己 的 寻 址 方案 。 我 们 现在 已 经 看 到 3 种 
类 型 的 地 址 : 应 用 层 的 主机 名 、 网 络 层 的 IP 地 址 以 及 链 路 层 的 MAC 地 址 。 








2. 地 址 解析 协议 


因为 存在 网 络 层 地 址 〈 例 如 ， 因 特 网 的 IP 地址 ) 和 链 路 层 地 址 (EI MAC 地 址 ) ， 所 
以 需要 在 它们 之 间 进 行 转换 。 对 于 因特网 而 言 ， 这 是 地 址 解析 协议 (Address Resolution 
Protocol, ARP)| RFC 826] 的 任务 。 

为 了 理解 对 于 诸如 ARP 这 样 协议 的 需求 ， 考 虑 如 图 6-17 所 示 的 网 络 。 在 这 个 简单 的 
例子 中 ， 每 台 主 机 和 路 由 器 有 一 个 单一 的 IP 地 址 和 单一 的 MAC 地 址 。 与 以 往 一 样 ，IP 地 
址 以 点 分 十 进 制 表示 法 表示 ，MAC 地 址 以 十 六 进 制 表示 法 表示 。 为 了 便于 讨论 ， 我们 在 
本 节 中 将 假设 交换 机 广播 所 有 帧 ; 这 就 是 说 ， 无 论 何 时 交换 机 在 一 个 接口 接收 一 个 帧 ， 它 
将 在 其 所 有 其 他 接口 上 转发 该 帧 。 在 下 一 节 中 ， 我 们 将 更 为 准确 地 解释 交换 机 操作 的 
过 程 。 
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图 6-17 局 域 网 上 的 每 个 接口 都 有 一 个 IP 地 址 和 一 个 MAC 地 址 
现在 假设 IP 地 址 为 222. 222. 222. 220 的 主机 要 加 主机 222. 222. 222. 222 发 送 IP 数据 
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报 。 在 本 例 中 ， 源 和 目的 均 位 于 相同 的 子 网 中 (在 4.3.3 节 中 的 寻 址 意义 下 ) ATEZ 
数据 报 ， 该 源 必 须要 回 它 的 适配器 不 仅 提供 了 下 数据 报 ， 而 且 要 提供 目的 主机 
222. 222. 222. 222 的 MAC 地 址 。 然 后 发 送 适 配 需 将 构造 一 个 包含 目的 地 的 MAC 地 址 的 链 
路 层 帧 ， 并 把 该 帧 发 送 进 局 域 网 。 

在 本 节 中 要 处 理 的 重要 问题 是 ， 发 送 主 机 如 何 确定 IP 地 址 为 222. 222. 222. 222 的 目的 
主机 的 MAC 地 址 呢 ? 正如 你 也 许 已 经 猜想 的 那样 ， 它 使 用 ARP。 在 发 送 主 机 中 的 ARP 模 
块 将 取 在 相同 局 域 网 上 的 任何 卫 地 址 作为 输入 ， 然 后 返回 相应 的 MAC 地 址 。 在 眼下 的 这 
个 例子 中 ， 发 送 主机 222. 222. 222. 220 向 它 的 ARP 模块 提供 了 IP 地 址 222. 222. 222. 222, 
并 且 其 ARP 模块 返回 了 相应 的 MAC 地 址 49-BD-D2-C7-56-2A。 

因此 我 们 看 到 了 ARP 将 一 个 IP 地 址 解析 为 一 个 MAC 地 址 。 在 很 多 方面 它 和 DNS 
(在 2.4 节 中 学 习 过 ) BW, DNS 将 主机 名 解析 为 IP 地 址 。 然 而 ， 这 两 种 解析 器 之 间 的 一 
个 重要 区 别 是 ，DNS 为 在 因特网 中 任何 地 方 的 主机 解析 主机 名 ， 而 ARP 只 为 在 同一 个 子 
网 上 的 主机 和 路 由 器 接口 解析 IP 地址。 如果 美 国 加 利 福 尼 亚 州 的 一 个 节点 试图 用 ARP 为 
美国 密西西比 州 的 一 个 节点 解析 IP 地址，ARP 将 返回 一 个 错误 。 

既然 已 经 解释 了 ARP 的 用 途 ， 我 们 再 来 看 看 它 是 如 何 工 作 的 。 每 台 主 机 或 路 由 器 在 
其 内 存 中 具有 一 个 ARP 表 (ARP table) ， 这 张 表 包含 IP 地 址 到 MAC 地 址 的 映射 关系 。 
6-18 显示 了 在 主机 222. 222. 222. 220 中 可 能 看 到 的 ARP 表 中 的 内 容 。 该 ARP 表 也 包含 
一 个 寿命 (TTL) 值 ， 它 指示 了 从 表 中 删除 每 个 映射 的 时 间 。 注 意 到 这 张 表 不 必 为 该 子 网 
上 的 每 台 主 机 和 路 由 需 都 包含 一 个 表 项 ; 某 些 可 能 从 来 没有 进入 到 该 表 中 ， 某 些 可 能 已 经 
过 期 。 从 一 个 表 项 放置 到 某 ARP 表 中 开始 ， 一 个 表 项 通常 的 过 期 时 间 是 20 分 钟 。 





图 6-18 在 主机 222. 222. 222. 220 中 的 一 个 可 能 的 ARP # 


现在 假设 主机 222. 222. 222. 220 要 发 送 一 个 数据 报 ， 该 数据 报 要 P 寻 址 到 本 子 网 上 另 
一 台 主 机 或 路 由 器 。 发 送 主机 需要 获得 给 定 IP 地 址 的 目的 主机 的 MAC 地 址 。 如 果 发 送 方 
的 ARP 表 具 有 该 目的 节点 的 表 项 ， 这 个 任务 是 很 容易 完成 的 。 但 如 果 ARP 表 中 当前 没有 
该 目的 主机 的 表 项 ， 又 该 怎么 办 呢 ? 特别 是 假设 222. 222. 222. 220 BE ja] 222. 222. 222. 222 
发 送 数据 报 。 在 这 种 情况 下 ， 发 送 方 用 ARP 协议 来 解析 这 个 地 址 。 首 先 ， 发 送 方 构造 一 
个 称 为 ARP 分 组 (ARP packet) 的 特殊 分 组 。 一 个 ARP 分 组 有 几 个 字段 ， 包 括 发 送 和 接 
收 IP 地 址 及 MAC 地 址 。ARP 查询 分 组 和 啊 应 分 组 都 具有 相同 的 格式 。ARP 查询 分 组 的 目 
的 是 询问 子 网 上 所 有 其 他 主机 和 路 由 器 ， 以 确定 对 应 于 要 解析 的 IP 地 址 的 那个 MAC 
地 址 。 

回 到 我 们 的 例子 上 来 ，222. 222. 222. 220 癌 它 的 适配器 传递 一 个 ARP 查询 分 组 ， 并 且 
指示 适配器 应 该 用 MAC 广播 地 址 (Bl FF-FF-FF-FF-FF-FF) 来 发 送 这 个 分 组 。 适 配 融 在 
链 路 层 帧 中 封装 这 个 ARP 分 组 ， 用 广播 地 址 作为 帧 的 目的 地 址 ， 并 将 该 帧 传输 进 子 网 中 。 
回想 我 们 的 社会 保险 号 /邮政 地 址 的 类 比 ， 一 次 ARP 查询 等 价 于 一 个 人 在 某 公 司 (比方 说 
AnyCorp) 一 个 拥挤 的 房间 大 喊 :“ 邮政 地 址 是 加 利 福 尼 亚 州 帕 罗 奥 图 市 AnyCorp 公司 112 
房间 13 室 的 那个 人 的 社会 保险 号 是 什么 ?” 包 含 该 ARP 查询 的 帧 能 被 子 网 上 的 所 有 其 他 
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Seara, IFA 〈 由 于 广播 地 址 ) ea Cae ABE EA PAY ARP 分 组 向 上 传递 给 
ARP 模块 。 这 些 ARP 模块 中 的 每 个 都 检查 它 的 IP 地 址 是 否 与 ARP 分 组 中 的 目的 IP 地 址 
相 匹 配 。 与 之 匹配 的 一 个 给 查询 主机 发 送 回 一 个 带 有 所 希望 映射 的 啊 应 ARP 分 组 。 然 后 
查询 主机 222. 222. 222. 220 能 够 更 新 它 的 ARP 表 ， 并 发 送 它 的 IP 数据 报 ， 该 数据 报 封装 
在 一 个 链 路 层 帧 中 ， 并 且 该 帧 的 目的 MAC 就 是 对 先前 ARP 请 求 进行 啊 应 的 主机 或 路 由 器 
的 MAC 地 址 。 

关于 ARP 协议 有 两 件 有 趣 的 事情 需要 注意 。 首 先 ， 查 询 ARP 报 文 是 在 广播 帧 中 发 送 
的 ， 而 啊 应 ARP 报 文 在 一 个 标准 帧 中 发 送 。 在 继续 阅读 之 前 ， 你 应 该 思考 一 下 为 什么 这 
样 。 其 次 ，ARP 是 即 插 即 用 的 ， 这 就 是 说 ， 一 个 ARP 表 是 自动 建立 的 ， 即 它 不 需要 系统 
管理 员 来 配置 。 并 且 如 果 某 主机 与 子 网 断 开 连接 ， 它 的 表 项 最 终 会 从 留 在 子 网 中 的 节点 的 
表 中 删除 掉 。 

FENA EERE ARP 是 一 个 链 路 层 协议 还 是 一 个 网 络 层 协议 。 如 我 们 所 看 到 的 那 
样 ， 一 个 ARP 分 组 封装 在 链 路 层 帧 中 ， 因 而 在 体系 结构 上 位 于 链 路 层 之 上 。 然 而 ， 一 个 
ARP 分 组 具有 包含 链 路 层 地 址 的 字段 ， 因 而 可 认为 是 链 路 层 协议 ， 但 它 也 包含 网 络 层 地 
址 ， 因 而 也 可 认为 是 为 网 络 层 协 议 。 所 以 ， 可 能 最 好 把 ARP 看 成 是 跨越 链 路 层 和 网 络 层 
边界 两 边 的 协议 ， 即 不 完全 符合 我 们 在 第 1 章 中 学 习 的 简单 的 分 层 协议 栈 。 现 实 世 界 协议 
就 是 这 样 复 杂 | 

3. 发 送 数据 报到 子 网 以 外 

现在 应 该 摘 清 楚 当 一 台 主 机 要 加 相同 子 网 上 的 另 一 台 主 机 发 送 一 个 数据 报时 ARP 的 
操作 过 程 。 但 是 现在 我 们 来 看 更 复杂 的 情况 ， 即 当 子 网 中 的 某 主 机 要 向 子 网 之 外 〈 也 就 是 
跨越 路 由 需 的 另 一 个 子 网 ) 的 主机 发 送 网 络 层 数据 报 的 情况 。 我 们 在 图 6-19 的 环境 中 来 
讨论 这 个 问题 ， 该 图 显示 了 一 个 由 一 人 台 路 由 天 互联 两 个 子 网 所 组 成 的 简单 网 络 。 
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图 6-19 由 一 台 路 由 顺 互 联 的 两 个 子 网 


AKRE 6-19 需要 注意 几 件 有 趣 的 事情 。 每 台 主 机 仅 有 一 个 PP 地 址 和 一 个 适配器 。 但 
是 ， 如 第 4 章 所 讨论 ， 一 台 路 由 器 对 它 的 每 个 接口 都 有 一 个 P 地 址 。 对 路 由 器 的 每 个 接 
口 ,〈 在 路 由 器 中 ) 也 有 一 个 ARP 模块 和 一 个 适 配 融 。 在 图 6-19 中 的 路 由 器 有 两 个 接口 ， 
所 以 它 有 两 个 IP 地 址 、 两 个 ARP 模块 和 两 个 适配器 。 当 然 ， 网 络 中 的 每 个 适配器 都 有 目 
己 的 MAC 地 址 。 

还 要 注意 到 子 网 1 的 网 络 地 址 为 111. 111. 111/24, 子 网 2 的 网 络 地 址 为 222. 222. 222/24, 
内 此 ， 与 子 网 1 相连 的 所 有 接口 都 有 格式 为 111. 111. 111. xxx 的 地 址 ， 与 子 网 2 相连 的 所 
有 接口 都 有 格式 为 222. 222. 222. xxx 的 地 址 。 

现在 我 们 考察 子 网 1 上 的 一 人 台 主 机 将 向 子 网 2 上 的 一 台 主 机 发 送 数据 报 。 特 别 是 ， 假 
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设 主机 111. 111. 111. 111 要 向 主机 222. 222. 222. 222 发 送 一 个 IP 数据 报 。 和 往常 一 样 ， 发 
送 主机 向 它 的 适配器 传递 数据 报 。 但 是 ， 发 送 主机 还 必须 向 它 的 适配器 指示 一 个 适当 的 目 
的 MAC 地 址 。 该 适配器 应 该 使 用 什么 MAC 地 址 呢 ? 有 人 也 许 大 胆 猜测 ， 这 个 适当 的 MAC 
地 址 就 是 主机 222. 222. 222. 222 的 适配器 地 址 ， 即 49- BD- D2-C7-56-2A。 然 而 ， 这 个 猜测 
是 错误 的 ! 如 果 发 送 适 配器 要 用 那个 MAC 地 址 ， 那 么 子 网 1 上 所 有 的 适配器 都 不 会 费心 
将 该 数据 报 传递 到 它 的 网 络 层 ， 因 为 该 帧 的 目的 地 址 与 子 网 1 上 所 有 适配器 的 MAC 地 
址 都 将 不 匹配 。 这 个 数据 报 将 只 有 和 死亡， 到达 数 据 报 天 国 。 

如 果 我 们 仔细 地 观察 图 6-19 ， 我 们 发 现 为 了 使 一 个 数据 报 从 111. 111.111.111 到 子 网 
2 上 的 主机 ， 该 数据 报 必须 首先 发 送 给 路 由 器 接口 111. 111. 111. 110， 它 是 通 往 最 终 目的 
地 路 径 上 的 第 一 跳 路 由 器 的 IP 地址。 因此 ， 对 于 该 帧 来 说 ， 适 当 的 MAC 地 址 是 路 由 器 接 
口 111.111.111.110 的 适配器 地 址 ， 即 E6- E9- 00- 17- BB- 4B。 但 发 送 主 机 怎样 获得 
111. 111. 111. 110 的 MAC 地 址 呢 ? 当然 是 通过 使 用 ARP! 一 旦 发 送 适 配器 有 了 这 个 MAC 
地 址 ， 它 创建 一 个 帧 〈 包 含 了 寻 址 到 222. 222. 222. 222 的 数据 报 ) ， 并 把 该 帧 发 送 到 子 网 1 
中 。 在 子 网 1 上 的 路 由 器 适配器 看 到 该 链 路 层 帧 是 向 它 寻 址 的 ， 因 此 把 这 个 帧 传递 给 路 由 
a Ze, A! 该 IP 数据 报 终于 被 成 功 地 从 源 主机 移动 到 这 台 路 由 器 了 ! 但 是 我 们 
的 任务 还 没有 结束 。 我 们 仍然 要 将 该 数据 报 从 路 由 器 移动 到 目的 地 。 路 由 器 现在 必须 决定 
该 数据 报 要 被 转发 的 正确 接口 。 如 在 第 4 章 中 所 讨论 的 ， 这 是 通过 查询 路 由 需 中 的 转发 表 
来 完成 的 。 转 发 表 告 诉 这 人 台 路 由 器 该 数据 报 要 通过 路 由 器 接口 222. 222. 222. 220 转发 。 然 
后 该 接口 把 这 个 数据 报 传递 给 它 的 适配器 ， 适 配器 把 该 数据 报 封装 到 一 个 新 的 帧 中 ， 并 且 
将 帧 发 送 进 子 网 2 中 。 这 时 ， 该 帧 的 目的 MAC 地 址 确实 是 最 终 目的 地 MAC 地 址 。 路 由 器 
又 是 怎样 获得 这 个 目的 地 MAC 地 址 的 呢 ? 当然 是 用 ARP 获得 的 ! 

用 于 以 太 网 的 ARP 定义 在 RFC 826 中 。 在 TCP/IP 指南 RFC 1180 中 对 ARP 进行 了 很 
好 的 介绍 。 我 们 将 在 课 后 习题 中 更 为 详细 地 研究 ARP., 


6. 4.2 以 太 网 


以 太 网 几乎 占领 着 现 有 的 有 线 局 域 网 市 场 。 在 20 世纪 80 FRA 90 年 代 早期 ， 以 太 
网 面临 着 来 自 其 他 局 域 网 技术 包括 令 牌 环 、FDDI 和 ATM 的 挑战 。 多 年 来 ， 这 些 其 他 技术 
中 的 一 些 成 功 地 抓 住 了 部 分 局 域 网 市 场 份 额 。 但 是 自从 20 世纪 70 年 代 中 期 发 明 以 太 网 以 
来 ， 它 就 不 断 演化 和 发 展 ， 并 保持 了 它 的 支配 地 位 。 今 天， 以 太 网 是 到 目前 为 止 最 流行 的 
有 线 局 域 网 技术 ， 而 且 到 可 能 预见 的 将 来 它 可 能 仍 保持 这 一 位 置 。 可 以 这 么 说 ， 以 太 网 对 
本 地 区 域 联 网 的 重要 性 就 像 因特网 对 全 球 联网 所 具有 的 地 位 那样 。 

以 太 网 的 成 功 有 很 多 原因 。 首 先 ， 以 太 网 是 第 一 个 广泛 部 署 的 高 速 局 域 网 。 因 为 它 部 
署 得 早 ， 网 络 管理 员 非 常熟 悉 以 太 网 ( 它 的 奇迹 和 它 的 奇 思 妙 想 ) ， 并 当 其 他 局 域 网 技术 
问世 时 ， 他 们 不 愿意 转 而 用 之 。 其 次 ， 令 牌 环 、FDDI 和 ATM 比 以 太 网 更 加 复杂 、 更 加 昂 
贵 ， 这 就 进一步 阻碍 了 网 络 管理 员 改 用 其 他 技术 。 第 三 ， 改 用 其 他 局 域 网 技术 (例如 
FDDI 和 ATM) 的 最 引 人 注 目的 原因 通常 是 这 些 新 技术 具有 更 高 数据 速率 ; 然而 以 太 网 总 
是 奋起 抗争 ， 产 生 了 运行 在 相同 或 更 高 数据 速率 下 的 版 本 。20 世纪 90 年 代 初 期 引入 了 交 
换 以 太 网 ， 这 就 进一步 增加 了 它 的 有 效 数 据 速 率 。 最 后 ， 由 于 以 太 网 已 经 很 流行 了 ， 所 以 
以 太 网 硬件 (尤其 是 适配器 和 交换 机 ) 成 了 一 个 普通 商品 ， 而 且 极为 便宜 。 

Bob Metcalfe 和 David Boggs 在 20 世纪 70 年 代 中 期 发 明 初 始 的 以 太 局 域 网 。 初 始 的 以 
太 局 域 网 使 用 同 轴 电 缆 总 线 来 互联 节点 。 以 太 网 的 总 线 拓 扑 实 际 上 从 20 世纪 80 年 代 到 90 
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年 代 中 期 一 直 保 持 不 变 。 使 用 总 线 拓扑 的 以 太 网 是 一 种 广播 局 域 网 ， 即 所 有 传输 的 帧 传送 
到 与 该 总 线 连 接 的 所 有 适配器 并 被 其 处 理 。 回 忆 一 下 ， 我 们 在 6. 3. 2 节 中 讨论 了 以 太 网 的 
具有 二 进 制 指数 回 退 的 CSMA/CD 多 路 访问 协议 。 

到 了 20 世纪 90 年 代 后 期 ， 大 多 数 公司 和 大 学 使 用 一 种 基于 集线器 的 星 形 拓扑 以 太 网 
安装 替代 了 它们 的 局 域 网 。 在 这 种 安装 中 ， 主 机 (和 路 由 器 ) 直接 用 双 绞 对 铜 线 与 一 台 集 
线 器 相连 。 集 线 器 (hub) 是 一 种 物理 层 设 备 ， 它 作用 于 各 个 比特 而 不 是 作用 于 帧 。 当 表 
示 一 个 0 或 一 个 1 的 比特 到 达 一 个 接口 时 ， 集线器 只 是 重新 生成 这 个 比特 ， 将 其 能 量 强 度 
放大 ， 并 将 该 比特 向 其 他 所 有 接口 传输 出 去 。 因 此 ， 采 用 基于 集线器 的 星 形 拓 扑 的 以 太 网 
也 是 一 个 广播 局 域 网 ， 即 无 论 何 时 集线器 从 它 的 一 个 接口 接收 到 一 个 比特 ， 它 向 其 所 有 其 
他 接口 发 送 该 比特 的 副本 。 特 别 是 ， 如 果 某 集线器 同时 从 两 个 不 同 的 接口 接收 到 帧 ， 将 出 
现 一 次 碰撞 ， 生 成 该 帧 的 节点 必须 重新 传输 该 帧 。 

在 21 世纪 初 ， 以 太 网 又 经 历 了 一 次 重要 的 革命 性 变化 。 以 太 网 安装 继续 使 用 星 形 拓 
扑 ， 但 是 位 于 中 心 的 集线器 被 交换 机 (switch) 所 替代 。 在 本 章 后 面 我 们 将 深入 学 习 交 换 
以 太 网 。 眼 下 我 们 仅 知 道 交 换 机 不 仅 是 “无 碰撞 的 ”， 而 且 也 是 名 副 其 实 的 存储 转发 分 组 
交换 机 就 可 以 了 ; 但 是 与 运行 在 高 至 第 三 层 的 路 由 器 不 同 ， 交 换 机 仅 运 行 在 第 二 层 。 

1. 以 太 网 帧 结构 

以 太 网 帧 如 图 6-20 所 示 。 通 过 仔细 研究 以 太 网 的 帧 ， 我 们 能 够 学 到 许多 有 关 以 太 网 
的 知识 。 


前 同步 码 ”目的 地 E 





图 6-20 以太 网 帧 结构 


为 了 将 对 以 太 网 帧 的 讨论 放 到 切实 的 环境 中 ， 考 虑 从 一 台 主 机 向 另 一 台 主 机 发 送 一 个 
IP 数据 报 ， 且 这 两 台 主 机 在 相同 的 以 太 局 域 网 上 〈 例 如 ， 如 图 6-17 所 示 的 以 太 局 域 网 ) 。 
(尽管 以 太 网 帧 的 负载 是 一 个 P 数据 报 ， 但 我 们 注意 到 以 太 网 帧 也 能 够 承载 其 他 网 络 层 分 
组 。) 设 发 送 适 配器 〈( 即 适配器 A) 的 MAC 地 址 是 AA-AA-AA-AA-AA-AA， 接 收 适 配器 
( 即 适 配器 B) 的 MAC 地 址 是 BB-BB-BB-BB-BB-BB。 发 送 适 配器 在 一 个 以 太 网 帧 中 封闭 
了 一 个 卫 数 据 报 ， 并 把 该 帧 传递 到 物理 层 。 接 收 适 配器 从 物理 层 收 到 这 个 帧 ， 提 取出 IP 
数据 报 ， 并 将 该 P 数据 报 传递 给 网 络 层 。 我 们 现在 在 这 种 情况 下 考察 如 图 6-20 所 示 的 以 
太 网 帧 的 6 个 字段 : 
© 数据 字段 (46 ~1500 字 节 ) 。 这 个 字段 承载 了 IP 数据 报 。 以 太 网 的 最 大 传输 单元 
(MTU) 是 1500 字 节 。 这 意味 着 如 果 IP 数据 报 超过 了 1500 字 节 ， 则 主机 必须 将 
该 数据 报 分 片 ， 如 4. 3. 2 节 所 讨论 。 数 据 字段 的 最 小 长 度 是 46 字 节 。 这 意味 着 如 
R I 数据 报 小 于 46 字 节 ， 数 据 报 必须 被 填充 到 46 字 节 。 当 采用 填充 时 ,传递 到 
网 络 层 的 数据 包括 IP 数据 报 和 填充 部 分 。 网 络 层 使 用 I 了 P 数据 报 首 部 中 的 长 度 字 段 
来 去 除 填充 部 分 。 
e 目的 地 址 (6 字 节 ) 。 这 个 字段 包含 目的 适配器 的 MAC 地 址 ， 即 BB- BB- BB- BB- 
BB-BB。 当 适配器 B 收 到 一 个 以 太 网 帧 ， 帧 的 目的 地 址 无 论 是 BB- BB- BB- BB- BB- 
BB， 还 是 MAC 广播 地 址 ， 它 都 将 该 帧 的 数据 字段 的 内 容 传递 给 网 络 层 ; 如 果 它 收 
到 了 具有 任何 其 他 MAC 地 址 的 帧 ， 则 丢弃 之 。 
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© 源 地 址 (6 字 节 )。 这 个 字段 包含 了 传输 该 帧 到 局 域 网 上 的 适配器 的 MAC 地 址 ， 
在 本 例 中 为 AA-AA-AA-AA-AA-AA。 

e 类 型 字段 (2 字 节 ) 。 类 型 字段 允许 以 太 网 复 用 多 种 网 络 层 协议 。 为 了 理解 这 点 ， 
我 们 需要 记 住 主机 能 够 使 用 除了 IP 以 外 的 其 他 网 络 层 协议 。 事 实 上 ， 一 台 给 定 的 
主机 可 以 支持 多 种 网 络 层 协议 ， 以 对 不 同 的 应 用 采用 不 同 的 协议 。 因 此 ， 当 以 太 
网 帧 到 达 适 配器 B， 适 配器 B 需要 知道 它 应 该 将 数据 字段 的 内 容 传 递 给 哪个 网 络 
层 协议 〈 即 分 解 ) IP 和 其 他 链 路 层 协议 (例如 ，Novell IPX 或 AppleTalk) 都 有 
它们 各 自 的 、 标 准 化 的 类 型 编号 。 此 外 ，ARP 协议 (在 上 一 节 讨 论 过 ) 有 自己 的 
类 型 编号 ， 并 且 如 果 到 达 的 帧 包含 ARP 分 组 ( 即 类 型 字段 的 值 为 十 六 进 制 的 
0806) ， 则 该 ARP 分 组 将 被 多 路 分 解 给 ARP 协议 。 注 意 到 该 类 型 字段 和 网 络 层 数 
据 报 中 的 协议 字段 、 运 输 层 报 文 段 的 端口 号 字段 相 类 似 ; 所 有 这 些 字段 都 是 为 了 
把 一 层 中 的 某 协议 与 上 一 层 的 某 协议 结合 起 来 。 

e CRC (4 字 节 )。 如 6.2.3 节 中 讨论 的 那样 ，CRC (循环 元 余 检测 ) 字段 的 目的 是 

使 得 接收 适配器 (适配器 B) 检测 帧 中 是 否 引 入 了 差错 。 

前 同步 码 (8 字 节 )。 以 太 网 帧 以 一 个 8 字 节 的 前 同步 码 (Preamble) 字段 开始 。 

该 前 同步 码 的 前 7 字 节 的 值 都 是 10101010; 最 后 一 个 字 节 是 10101011。 前 同步 码 

字段 的 前 7 字 节 用 于 “唤醒 ”接收 适配器 ， 并 且 将 它们 的 时 钟 和 发 送 方 的 时 钟 同 

步 。 为 什么 这 些 时 钟 会 不 同步 呢 ?” 记 住 适 配器 A 的 目的 是 根据 以 太 局 域 网 类 型 的 

不 同 ， 分 别 以 10Mbps、100Mbps 或 者 1Gbps 的 速率 传输 帧 。 然 而 ， 没 有 什么 是 完 

美 无 缺 的 ， 因 此 适配器 A 不 会 以 精确 的 额定 速率 传输 帧 ; 相对 于 额定 速率 总 有 一 

些 漂移 ， 局 域 网 上 的 其 他 适配器 不 会 预先 知道 这 种 漂移 的 。 接 收 适配器 只 需 通 过 

锁定 前 同步 码 的 前 7 字 节 的 比特 ， 就 能 够 锁定 适配器 A 的 时 钟 。 前 同步 码 的 第 8 

个 字 节 的 最 后 两 个 比特 (第 一 个 出 现 的 两 个 连续 的 1) 警告 适配器 B,“ 重 要 的 内 

容 ” 就 要 到 来 了 。 

所 有 的 以 太 网 技术 都 向 网 络 层 提供 无 连接 服务 。 这 就 是 说 ， 当 适配器 A 要 向 适配器 B 
发 送 一 个 数据 报时 ， 适 配器 A 在 一 个 以 太 网 帧 中 封装 该 数据 报 ， 并 且 把 该 帧 发 送 到 局 域 网 
上 ， 没 有 先 与 适配器 B 握手 。 这 种 第 二 层 的 无 连接 服务 类 似 于 IP 的 第 三 层 数据 报 服务 和 
UDP 的 第 四 层 无 连接 服务 。 

以 太 网 技术 都 向 网 络 层 提 供 不 可 靠 服 务 。 特 别 是 ， 当 适配器 B 收 到 一 个 来 自 适 配器 A 
的 帧 ， 它 对 该 帧 执行 CRC 校 验 ， 但 是 当 该 帧 通过 CRC 校 验 时 它 既 不 发 送 确认 帧 ; 而 当 该 
帧 没有 通过 CRC 校 验 时 它 也 不 发 送 否 定 确 认 帧 。 当 某 帧 没有 通过 CRC 校 验 ， 适 配器 B 只 
是 丢弃 该 帧 。 因 此 ， 适 配器 A 根本 不 知道 它 传输 的 帧 是 否 到 达 了 B 并 通过 了 CRC 校 验 。 
(在 链 路 层 ) 缺乏 可 靠 的 传输 有 助 于 使 得 以 太 网 简单 和 便宜 。 但 是 它 也 意味 着 传递 到 网 络 
层 的 数据 报 流 能 够 有 间隙 。 

如 果 由 于 丢弃 了 以 太 网 帧 而 存在 间隙 ， 主 机 B 上 的 应 用 也 会 看 见 这 个 间隙 吗 ? 如 我 们 
在 第 3 章 中 学 习 的 那样 ， 这 只 取决 于 该 应 用 是 使 用 UDP 还 是 使 用 TCP。 如 果 应 用 使 用 的 是 
UDP， 则 主机 B 中 的 应 用 的 确 会 看 到 数据 中 的 间隙 。 另 一 方面 ， 如 果 应 用 使 用 的 是 TCP, 
则 主机 B 中 的 TCP 将 不 会 确认 包含 在 丢弃 帧 中 的 数据 ， 从 而 引起 主机 A 的 TCP 重 传 。 注 
意 到 当 TCP 重 传 数据 时 ， 数 据 最 终 将 回 到 曾经 丢弃 它 的 以 太 网 适配器 。 因 此 ， 从 这 种 意义 
上 来 说 ， 以 太 网 的 确 重 传 了 数据 ， 尽 管 以 太 网 并 不 知道 它 是 正在 传输 一 个 具有 全 新 数据 的 
全 新 数据 报 ， 还 是 一 个 包含 已 经 被 传输 过 至 少 一 次 的 数据 的 数据 报 。 
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Bob Metcalfe 和 以 太 网 


作为 20 世纪 70 年代 早 期 哈佛 大 学 的 一 名 博士 生 ，Bob Metcalfe 在 MIT 从 事 ARPA- 
net 的 研究 。 在 他 学 习 期 间 ， 他 还 受到 了 Abramson 有 关 ALOHA 和 随机 接 入 协议 工作 的 
| 影响 。 在 完成 了 他 的 博士 学 位 ， 并 在 开始 Xerox Palo Alto FR PS (Xerox PARC) 的 工 
| 作 之 前 ， 他 用 3 个 月 访问 了 Abramson 和 他 在 夏威夷 大 学 的 同事 ， 获 得 了 ALOHAnet 的 第 
一 手 资料 。 在 Xerox PARC, Metcalfe 受到 了 Alto 计算 机 的 影响 ， 这 种 计算 机 在 很 多 方面 
| 是 20 世纪 80 年 代 个 人 计算 机 的 先驱 。Metcalfe 看 到 了 对 这 些 计 算 机 以 一 种 不 昂贵 的 方 
式 组 网 的 需求 。 因 此 ， 基 于 他 在 APRAnet、ALOHAnet 和 随机 接 入 协议 方面 的 知识 ， 
Metcalfe 和 他 的 同事 David Boggs 一 起 发 明了 以 太 网 。 
Metcalfe 和 Boggs 的 初始 以 太 网 运行 速度 为 2.94Mbps， 连 接 长 达 一 英里 范围 的 多 达 
256 台 主 机 。 Metcalfe 和 Boggs 成 功 地 使 得 Xerox PARC 的 大 多 数 研究 人 员 通 过 他 们 的 
| Alto 计算 机 互相 通信 。 然 后 Metcalfe 推进 了 Xerox, Digital 和 Intel KA, ATAKA 
作为 一 种 10Mbps 的 以 太 网 标准 ， 该 标准 后 被 IEEE 认可 。Xerox 对 以 太 网 商业 化 没有 表 | 
| 现 出 太 多 的 兴趣 。1979 年 ，Metcalfe 建立 了 自己 的 公司 3Com， 它 发 展 和 商业 化 包括 以 | 
| 太 网 技术 在 内 的 联网 技术 。 特 别 是 ，3Com 在 20 世纪 80 年 代 早期 为 非常 流行 的 IBM PC 


| 开发 了 以 太 网 网 卡 并 使 之 市 场 化 。 
| — pa 人 ee e a a Daa a 




















2. 以 太 网 技术 

在 以 上 的 讨论 中 我 们 已 经 提 到 以 太 网 ， 仿 佛 它 有 单一 的 协议 标准 似 的 。 但 事实 上 ， 以 
太 网 具有 许多 不 同 的 特色 ， 具 有 某 种 令 人 眼花 综 乱 的 首 字 母 缩 写 词 ， 如 10BASE-T, 
10BASE-2、100BASE-T、1000BASE-LX 和 10GBASE-T。 这 些 以 及 许多 其 他 的 以 太 网 技术 
在 多 年 中 已 经 被 I[EEE 802.3 CSMA/CD( Ethernet) 工作 组 标准 化 了 [IEEE 802.3 2012 ] 。 
尽管 这 些 首 字母 缩写 词 看 起 来 眼花 综 乱 ,实际 上 其 中 非常 有 规律 性 。 首 字母 缩写 词 的 第 一 
部 分 指 该 标准 的 速率 : 10、100、1000 或 10G, 分 别人 代表 10Mbps、100Mbps、1000Mbps 
(或 1Gbps) 和 10Gbps 以 太 网 。 “BASE” 指 基带 以 太 网 ， 这 意味 着 该 物理 媒体 仅 承 载 以 太 
网 流量 ; 几乎 所 有 的 802.3 标准 都 适用 于 基带 以 太 网 。 该 首 字母 缩写 词 的 最 后 一 部 分 指 物 
理 媒 体 本 身 ; 以 太 网 是 链 路 层 也 是 物理 层 的 规范 ， 并 且 能 够 经 各 种 物理 媒体 (包括 同 轴 电 
绕 、 铜 线 和 光纤 ) 承载 。 一 般 而 言 ，“T” 指 双 绞 铜 线 。 

从 历史 上 讲 ， 以 太 网 最 初 被 构想 为 一 段 同 轴 电 缆 。 早 期 的 10BASE-2 和 10BASE-5 标 
准 规定 了 在 两 种 类 型 的 同 轴 电 缆 之 上 的 10Mbps 以 太 网 ， 每 种 标准 都 限制 在 500 米 长 度 之 
内 。 通 过 使 用 转发 器 (repeater) 能 够 得 到 更 长 的 运行 距离 ， 而 转发 器 是 一 种 物理 层 设 备 ， 
它 能 在 输入 端 接收 信和 号 并 在 输出 端 再 生 该 信号 。 同 轴 电 缆 很 好 地 对 应 于 我 们 将 作为 一 种 广 
播 媒 体 的 以 太 网 视图 ， 即 由 一 个 接口 传输 的 所 有 帧 可 在 其 他 接口 收 到 ， 并 且 以 太 网 的 
CSMA/CD 协议 很 好 地 解决 了 多 路 访问 问题 。 节 点 直接 附着 在 电缆 上 ， 万 事 大 吉 ， 我 们 有 
了 一 个 局 域 网 了 ! 

多 年 来 以 太 网 已 经 经 历 了 一 系列 演化 步骤 ,今天 的 以 太 网 非常 不 同 于 使 用 同 轴 电 线 的 
初始 总 线 拓 扑 的 设计 。 在 今天 大 多 数 的 安装 中 ， 节 点 经 点 对 点 的 由 双 绞 铜 线 或 光纤 线 绕 构 
成 的 线段 与 一 台 交 换 机 相连 ， 如 图 6-15 至 图 6-17 所 示 。 
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在 20 世纪 90 年 代 中 期 ， 以 太 网 被 标准 化 为 100Mbps， 比 10Mbps LAA AIR 10 倍 。 初 
始 的 以 太 网 MAC 协议 和 帧 格式 保留 了 下 来 ,但 更 高 速率 的 物理 层 被 定义 为 用 铜 线 
(100BASE-T) 和 用 光纤 (100BASE-FX、100BASE-SX、100BASE-BX) 。 图 6-21 显示 了 这 
些 不 同 的 标准 和 共同 的 以 太 网 MAC 协议 和 帧 格式 。100Mbps 以 太 网 用 双 绞 线 距离 限制 为 
100 米 ， 用 光纤 距离 限制 为 几 千 米 ， 人 允许 把 不 同 建筑 物 中 的 以 太 网 交换 机 连接 起 来 。 


MAC 协 议和 帧 格式 


| | 100BASE-TX || 100BASE-T2 || 100BASE-FX 
|| 100BASE-T4 || 100BASE-SX || 100BASE-BX 


图 6-21 100Mbps 以 太 网 标准 : 共同 的 链 路 层 ， 不 同 的 物理 层 


吉 比 特 以 太 网 是 对 极为 成 功 的 10Mbps 和 100Mbps 以 太 网 标准 的 扩展 。40Gbps 以 太 网 
提供 40 000Mbps 的 总 数据 速率 ， 与 大 量 已 经 安装 的 以 太 网 设备 基础 保持 完全 兼容 。 吉 比 
特 以 太 网 的 标准 称 为 IEEE 802. 3z， 它 完成 以 下 工作 : 

o 使 用 标准 以 太 网 帧 格式 (参见 图 6-20) ， 并 且 后 向 兼容 10BASE-T 与 100BASE-T 

技术 。 这 使 得 吉 比 特 以 太 网 和 现 已 安装 的 以 太 网 设备 基础 很 容易 集成 。 

e 人 允许 点 对 点 链 路 以 及 共享 的 广播 信道 。 如 前 所 述 ， 点 对 点 链 路 使 用 交换 机 ， 而 广 

播 信道 使 用 集线器 。 在 吉 比 特 以 太 网 术语 中 ， 集 线 器 被 称 为 “ 带 缓存 的 分 配器 ”。 

e 使 用 CSMA/CD 来 共享 广播 信道 。 为 了 得 到 可 接受 的 效率 ， 节 点 之 间 的 最 大 距离 

必须 严格 限制 。 

e 对 于 点 对 点 信道 ， 人 允许 在 两 个 方向 上 都 以 40Gbps 全 双 工 操作 。 

吉 比 特 以 太 网 最 初 工作 于 光纤 之 上 ， 现 在 能 够 工作 在 5 类 UTP RAE. 

我 们 通过 提出 一 个 问题 来 结束 有 关 以 太 网 技术 的 讨论 ， 这 个 问题 开始 可 能 会 难 倒 你 。 
在 总 线 拓扑 和 基于 集线器 的 星 形 拓扑 技术 时 代 ， 以 太 网 很 显然 是 一 种 广播 链 路 〈 如 6. 3 节 
所 定义 ) ， 其 中 多 个 节点 同时 传输 时 会 出 现 帧 碰撞 。 为 了 处 理 这 些 磁 撞 ， 以 太 网 标准 包括 
了 CSMA/CD 协议 ， 该 协议 对 于 跨越 一 个 小 的 地 理 半 径 的 有 线 广 播 局 域 网 特别 有 效 。 但 是 
对 于 今天 广 为 使 用 的 以 太 网 是 基于 交换 机 的 星 形 拓扑 ， 采 用 的 是 存储 转发 分 组 交换 ， 是 否 
还 真正 需要 一 种 以 太 网 MAC 协议 呢 ? 如 我 们 很 快 所 见 ， 交 换 机 协调 其 传输 ， 在 任何 时 候 
决 不 会 向 相同 的 接口 转发 超过 一 个 帧 。 此 外 ， 现 代 交 换 机 是 全 双 工 的 ， 这 使 得 一 台 交 换 机 
和 一 个 节点 能 够 在 同时 向 对 方 发 送 帧 而 没有 干扰 。 换 名 话说， 在 基于 交换 机 的 以 太 局 域 网 
中 ， 不 会 有 碰撞 ， 因 此 没有 必要 使 用 MAC 协议 了 ! 

如 我 们 所 见 ， 今天 的 以 太 网 与 Metcalfe 和 Boggs 在 30 多 年 前 构想 的 初始 以 太 网 有 非常 
大 的 不 同 ， 即 速度 已 经 增加 了 3 个 数量 级 ， 以 太 网 帧 承载 在 各 种 各 样 的 媒体 之 上 ， 交 换 以 
太 网 已 经 成 为 主流 ， 此 时 甚至 连 MAC 协议 也 经 常 是 不 必要 的 了 ! 所 有 这 些 还 真正 是 以 太 
网 吗 ? 答案 当然 是 :“ 是 的 ， 根 据 定 义 如 此 。” 然而 ,注意 到 下 列 事实 是 有 趣 的 : 通过 所 有 
这 些 改变 ， 的 确 还 有 一 个 历经 30 年 保持 未 变 的 持久 不 变量 ， 即 以 太 网 帧 格式 。 也 许 这 才 
是 以 太 网 标准 的 一 个 真正 重要 的 特征 。 


6.4.3 链 路 层 交 换 机 
到 目前 为 止 ， 我 们 有 意 对 交换 机 实际 要 做 的 工作 以 及 它 是 怎样 工作 的 含糊 其 律 。 交 换 
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机 的 任务 是 接收 入 链 路 层 帧 并 将 它们 转发 到 出 链 路 ; 我 们 将 在 这 一 节 中 详细 学 习 这 种 转发 
功能 。 我 们 将 看 到 交换 机 自身 对 子 网 中 的 主机 和 路 由 器 是 透明 的 (transparent ) ; 这 就 是 
说 ， 某 主机 /路 由 器 向 另 一 个 主机 /路 由 器 寻 址 一 个 帧 〈 而 不 是 向 交换 机 寻 址 该 帧 ) ， 顺 利 
地 将 该 帧 发 送 进 局 域 网 ， 并 不 知道 某 交 换 机 将 会 接收 该 帧 并 将 它 转发 到 另 一 个 节点 。 这 些 
帧 到 达 该 交换 机 的 任何 输出 接口 之 一 的 速率 可 能 暂时 会 超过 该 接口 的 链 路 容量 。 为 了 解决 
这 个 问题 ， 交 换 机 输出 接口 设 有 缓存 ， 这 非常 类 似 于 路 由 器 接口 为 数据 报 设 有 缓存 。 现 在 
我 们 来 仔细 考察 交换 机 运行 的 原理 。 

1. 交换 机 转发 和 过 滤 

过 滤 (filtering) 是 决定 一 个 帧 应 该 转发 到 某 个 接口 还 是 应 当 将 其 丢弃 的 交换 机 功能 。 
转发 (forwarding) 是 决定 一 个 帧 应 该 被 导向 哪个 接口 ， 并 把 该 帧 移动 到 那些 接口 的 交换 
机 功能 。 交 换 机 的 过 滤 和 转发 借助 于 交换 机 表 (switch table) 完成 。 该 交换 机 表 包 含 某 局 
域 网 上 某 些 主机 和 路 由 器 的 但 不 必 是 全 部 的 表 项 。 交 换 机 表 中 的 一 个 表 项 包含 : 中 一 个 
MAC 地 址 ; @ 通 向 该 MAC 地 址 的 交换 机 接口 ; @ 表 项 放置 在 表 中 的 时 间 。 图 6-22 中 显示 
了 图 6-15 中 最 上 方 交 换 机 的 一 个 交换 机 表 的 例子 。 尽 管 帧 转发 的 描述 听 起 来 类 似 于 第 4 
章 讨论 的 数据 转发 ， 但 我 们 将 很 快 看 到 它们 之 间 有 重要 的 差异 。 确 实在 4. 4 节 中 一 般 化 转 
发 的 讨论 中 我 们 学 习 过 ， 许 多 现代 分 组 交换 机 能 够 被 配置 ， 以 基于 第 二 层 目 的 MAC 地 址 
( 即 起 着 第 二 层 交 换 机 的 功能 ) 或 者 第 三 层 下 目的 地 址 〈 即 起 着 第 三 层 交 换 机 的 功能 ) 进 
行 转发 。 无 论 如 何 ， 我 们 将 对 交换 机 基于 MAC 地 址 而 不 是 基于 IP 地 址 转发 分 组 进行 明确 
区 分 。 我 们 也 将 看 到 传统 的 〈 即 处 于 非 SDN 环境 ) 交换 机 表 的 构造 方式 与 路 由 器 转发 表 
的 构造 方式 有 很 大 不 同 。 

地 址 
62-FE-F7-11-89-A3 


7C-BA-B2-B4-91-10 





图 6-22 图 6-15 中 最 上 面 交 换 机 的 交换 机 表 的 一 部 分 


为 了 理解 交换 机 过 滤 和 转发 的 工作 过 程 ， 假 定 目的 地 址 为 DD-DD-DD-DD-DD-DD 的 
帧 从 交换 机 接口 x 到 达 。 交 换 机 用 MAC 地 址 DD-DD-DD-DD-DD-DD 索引 它 的 表 。 有 3 种 
可 能 的 情况 : 
e 表 中 没有 对 于 DD-DD-DD-DD-DD-DD 的 表 项 。 在 这 种 情况 下 ， 交 换 机 向 除 接口 x 
外 的 所 有 接口 前 面 的 输出 缓存 转发 该 帧 的 副本 。 换 言 之 ， 如 果 没 有 对 于 目的 地 址 
的 表 项 ， 交 换 机 广播 该 帧 。 
。 表 中 有 一 个 表 项 将 DD-DD-DD-DD-DD-DD 与 接口 x 联系 起 来 。 在 这 种 情况 下 ， 该 
帧 从 包括 适 配 融 DD-DD-DD-DD-DD-DD 的 局 域 网 网 段 到 来 。 无 须 将 该 帧 转发 到 任 
何其 他 接口 ， 交 换 机 通过 丢弃 该 帧 执行 过 滤 功 能 即 可 。 
e 表 中 有 一 个 表 项 将 DD-DD-DD-DD-DD-DD 与 接口 yx 联系 起 来 。 在 这 种 情况 下 ， 
该 帧 需要 被 转发 到 与 接口 y 相连 的 局 域 网 网 段 。 交 换 机 通过 将 该 帧 放 到 接口 y 前 
面 的 输出 缓存 完成 转发 功能 。 
我 们 大 致 地 看 一 下 用 于 图 6-15 中 最 上 面 交 换 机 的 这 些 规则 以 及 图 6-22 中 所 示 的 它 的 
交换 机 表 。 假 设 目的 地 址 为 62-FE-F7-11-89-A3 的 一 个 帧 从 接口 1 到 达 该 交换 机 。 交 换 机 
检查 它 的 表 并 且 发 现 其 目的 地 是 在 与 接口 1 相连 的 局 域 网 网 段 上 ( 即 电 气 工程 系 的 局 域 
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网 ) 。 这 意味 着 该 帧 已 经 在 包含 目的 地 的 局 域 网 网 段 广播 过 了 。 因 此 该 交换 机 过 滤 (BIE 
F) 了 该 帧 。 现 在 假设 有 同样 目的 地 址 的 帧 从 接口 2 到 达 。 交 换 机 再 次 检查 它 的 表 并 且 发 现 
其 目的 地 址 在 接口 1 的 方向 上 ; 因此 它 向 接口 1 前 面 的 输出 缓存 转发 该 帧 。 这 个 例子 清楚 地 
表明 ， 只 要 交换 机 的 表 是 完整 和 准确 的 ， 该 交换 机 无 须 任 何 广播 就 向 着 目的 地 转发 帧 。 

在 这 种 意义 上 ， 交 换 机 比 集 线 器 更 为 “聪明 ”。 但 是 一 开始 这 个 交换 机 表 是 如 何 配置 
起 来 的 呢 ? 链 路 层 有 与 网 络 层 路 由 选择 协议 等 价 的 协议 吗 ? 或 者 必须 要 一 名 超 负荷 工作 的 
管理 员 人 工地 配置 交换 机 表 吗 ? 

2. HFJ 

交换 机 具有 令 人 惊奇 的 特性 (特别 是 对 于 早已 超 负 蓓 工作 的 网 络 管理 员 )， 那 就 是 它 
的 表 是 自动 、 动 态 和 自治 地 建立 的 ， 即 没有 来 自 网 络 管理 员 或 来 自 配 置 协议 的 任何 干预 。 
换 句 话说 ， 交 换 机 是 自学 习 (self-learning) 的 。 这 种 能 力 是 以 如 下 方式 实现 的 : 

1) 交换 机 表 初 始 为 空 。 

2) 对 于 在 每 个 接口 接收 到 的 每 个 人 帧 ， 该 交换 机 在 其 表 中 存储 : 四 在 该 帧 源 地 址 字 
段 中 的 MAC 地 址 ; 多) 该 帧 到 达 的 接口 ; @ 当 前 时 间 。 交 换 机 以 这 种 方式 在 它 的 表 中 记录 
了 发 送 节点 所 在 的 局 域 网 网 段 。 如 果 在 局 域 网 上 的 每 个 主机 最 终 都 发 送 了 一 个 帧 ， 则 每 个 
主机 最 终 将 在 这 张 表 中 留 有 记录 。 

3) 如 果 在 一 段 时 间 (PRA ZACH (aging time)) 后 ， 交 换 机 没有 接收 到 以 该 地 址 作 
为 源 地 址 的 帧 ， 就 在 表 中 删除 这 个 地 址 。 以 这 种 方式 ， 如 果 一 台 PC 被 男 一 台 PC (具有 不 
同 的 适配器 ) 代替 ， 原 来 PC 的 MAC 地 址 将 最 终 从 该 交换 机 表 中 被 清除 掉 。 

我 们 粗略 地 看 一 下 用 于 图 6-15 中 最 上 面 交 换 机 的 自学 习性 质 以 及 在 图 6-22 中 它 对 应 
的 交换 机 表 。 假 设 在 时 刻 9:39， 源 地 址 为 01-12-23-34-45-56 的 一 个 帧 从 接口 2 到 达 。 假 
设 这 个 地 址 不 在 交换 机 表 中 。 于 是 交换 机 在 其 表 中 增加 一 个 新 的 表 项 ， 如 图 6-23 中 所 示 。 


地 址 
01-12-23-34-45-56 


62-FE-F7-11-89-A3 


7C-BA-B2-B4-91-10 : 
a ees. E 
图 6-23 交换 机 学 习 到 地 址 为 01-12-23-34-45-56 的 适配器 所 在 的 位 置 
继续 这 个 例子 ， 假 设 该 交换 机 的 老化 期 是 60min， 在 9: 32 ~ 10: 32 期 间 源 地 址 是 
62-FE-F7-11-89-A3 的 帧 没有 到 达 该 交换 机 。 那 么 在 时 刻 10: 32， 这 人 台 交换 机 将 从 它 的 表 
中 删除 该 地 址 。 
交换 机 是 即 插 即 用 设备 (plug-and-play device) ， 因 为 它们 不 需要 网 络 管理 员 或 用 户 的 
干预 。 要 安装 交换 机 的 网 络 管理 员 除了 将 局 域 网 网 段 与 交换 机 的 接口 相连 外 ， 不 需要 做 其 
他 任何 事 。 管 理 员 在 安装 交换 机 或 者 当 某 主机 从 局 域 网 网 段 之 一 被 去 除 时 ， 他 没有 必要 配 
置 交 换 机 表 。 交 换 机 也 是 双 工 的 ， 这 意味 着 任何 交换 机 接口 能 够 同时 发 送 和 接收 。 
3. 链 路 层 交 换 机 的 性 质 


在 描述 了 链 路 层 交 换 机 的 基本 操作 之 后 ， 我 们 现在 来 考虑 交换 机 的 特色 和 性 质 。 我 们 能 够 
指出 使 用 交换 机 的 几 个 优点 ， 它 们 不 同 于 如 总 线 或 基于 集线器 的 星 形 拓 扑 那样 的 广播 链 路 ; 
o 消除 碰撞 。 在 使 用 交换 机 〈 不 使 用 集线器 ) 构建 的 局 域 网 中 ， 没 有 因 碰 撞 而 浪费 
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的 带宽 ! 交换 机 缓存 帧 并 且 决 不 会 在 网 段 上 同时 传输 多 于 一 个 帧 。 就 像 使 用 路 由 
an —Ff, ， 交 换 机 的 最 大 聚合 带宽 是 该 交换 机 所 有 接口 速率 之 和 。 因 此 ， 交 换 机 提 
供 了 比 使 用 广播 链 路 的 局 域 网 高 得 多 的 性 能 改善 。 

© 异 质 的 链 路 。 交 换 机 将 链 路 彼此 隔离 ， 因 此 局 域 网 中 的 不 同 链 路 能 够 以 不 同 的 速 
率 运 行 并 且 能 够 在 不 同 的 媒体 上 运行 。 例 如 ， 图 6-22 中 最 上 面 的 交换 机 有 3 条 
1Gbps 1000BASE-T 铜 缆 链 路 、2 条 100Mbps 1OBASE- FX 光缆 链 路 和 1 条 100 
BASE-T 铜 缆 链 路 。 因此 ， 对 于 原 有 的 设备 与 新 设备 混用 ， 交 换 机 是 理想 的 。 

e 管理 。 除 了 提供 强化 的 安全 性 〈 人 参见 插入 材料 “关注 安全 性 ”) ， 交 换 机 也 易于 进 
行 网 络 管理 。 例 如 ， 如 果 一 个 适配器 工作 异常 并 持续 发 送 以 太 网 帧 〈 称 为 快 而 含 
WAH (jabbering) 适 配 需 ) ,交换机 能 够 检测 到 该 问题 ， 并 在 内 部 断 开 异常 适 配 
船 。 有 了 这 种 特色 ， 网 络 管理 员 不 用 起 床 并 开车 到 工作 场所 去 解决 这 个 问题 。 类 
似 地 ， 一 条 割断 的 缆 线 仅 使 得 使 用 该 条 缆 线 连接 到 交换 机 的 主机 断 开 连接 。 在 使 
用 同 轴 电 费 的 时 代 ， 许 多 网 络 管理 员 花 费 几 个 小 时 “沿线 巡 检 ”或 者 更 准确 地 
Bi “ERRET” ) ， 以 找到 使 整个 网 络 瘫痪 的 电缆 断 开 之 处 。 交 换 机 也 收集 
带宽 使 用 的 统计 数据 、 碰 撞 率 和 流量 类 型 ， 并 使 这 些 信息 为 网 络 管理 者 使 用 。 这 
些 信息 能 够 用 于 调试 和 解决 问题 ， 并 规划 该 局 域 网 在 未 来 应 当 演 化 的 方式 。 研 究 
人 员 还 在 原型 系统 部 署 中 探讨 在 以 太 局 域 网 中 增加 更 多 的 管理 功能 [Casado 2007 ; 
Koponen 2011 | 。 













嗅 探 交换 局 域 网 : 交换 机 毒化 


当 一 台 主 机 与 某 交 换 机 相连 时 ， 它 通常 仅 接 收 到 明确 发 送 给 它 的 帧 。 例 如 ， 考 虑 在 
图 6-17 中 的 一 个 交换 局 域 网 。 当 主机 A 向 主机 BB 发 送 帧 时 ， 在 交换 机 表 中 有 用 于 主机 
| B 的 表 项 ， 则 该 交换 机 将 仅 向 主机 B 转发 该 帧 。 如 果 主 机 C 恰好 在 运行 嗅 探 器 ， 主 机 C 
将 不 能 够 嗅 探 到 A 到 B 的 帧 。 因 此 ， 在 交换 局 域 网 的 环境 中 (与 如 802. 11 局 域 网 或 基 
于 集线器 的 以 太 局 域 网 的 广播 链 路 环境 形成 对 比 ) ， 攻 击 者 嗅 探 帧 更 为 困难 。 然 而 ， 因 
为 交换 机 广播 那些 目的 地 址 不 在 交换 机 表 中 的 帧 ， 位 于 C 上 的 嗅 探 器 仍然 能 嗅 探 某 些 不 
是 明确 寻 址 到 C 的 帧 。 此 外 ， 嗅 探 器 将 能 够 嗅 探 到 具有 广播 地 址 FF-FF-FF-FF-FF-FF 的 
广播 帧 。 一 个 众所周知 的 对 抗 交换 机 的 攻击 称 为 交换 机 毒化 (switch poisoning) ， 它 向 交 
| 换 机 发 送 大 量 的 具有 不 同 伪造 源 MAC 地 址 的 分 组 ， 因 而 用 伪造 表 项 填 满 了 交换 机 表 ， 
没有 为 合法 主机 留 下 空间 。 这 使 该 交换 机 广播 大 多 数 帧 ， 这 些 帧 则 能 够 由 嗅 探 器 停 获 到 
| [Skoudis 2006] 。 由 于 这 种 攻击 只 有 技艺 高 超 的 攻击 者 才能 做 到 ， 因 此 交换 机 比 起 集 线 
器 和 无 线 局 域 网 来 更 难受 到 嗅 探 。 





4 交换 机 和 路 由 载 比 较 


如 我 们 在 第 4 章 学 习 的 那样 ， 路 由 器 是 使 用 网 络 层 地 址 转发 分 组 的 存储 转发 分 组 交换 
机 。 尽 管 交 换 机 也 是 一 个 存储 转发 分 组 交换 机 ， 但 它 和 路 由 器 是 根本 不 同 的 ， 因 为 它 用 
MAC 地 址 转发 分 组 。 交 换 机 是 第 二 层 的 分 组 交换 机 ， 而 路 由 器 是 第 三 层 的 分 组 交换 机 。 
然而 ， 回 顾 我 们 在 4. 4 节 中 所 学 习 的 内 容 ， 使 用 “匹配 加 动作 ”的 现代 交换 机 能 够 转发 基 
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于 帧 的 目的 MAC 地 址 的 第 二 层 帧 ， 也 能 转发 使 用 数据 报 目 的 IP 地 址 的 第 三 层 数据 报 。 我 
们 的 确 看 到 了 使 用 OpenFlow 标准 的 交换 机 能 够 基于 11 个 不 同 的 帧 、 数 据 报 和 运输 层 首部 
字段 ， 执 行 通用 的 分 组 转发 。 

即使 交换 机 和 路 由 器 从 根本 上 是 不 同 的 ， 网 络 管理 员 在 安装 互联 设备 时 也 经 稼 必须 在 
它们 之 间 进 行 选 择 。 例 如 ， 对 于 图 6-15 中 的 网 络 ， 网 络 管理 员 本 来 可 以 很 容易 地 使 用 路 
由 器 而 不 是 交换 机 来 互联 各 个 系 的 局 域 网 、 服 务 器 和 互联 网 网 关 路 由 絮 。 路 由 右 的 确 使 得 
各 系 之 间 通 信和 而 不 产生 碰撞 。 既 然 交 换 机 和 路 由 需 都 是 候选 的 互联 设备 ， 那 么 这 两 种 方式 
的 优点 和 缺点 各 是 什么 呢 ? 

首先 考虑 交换 机 的 优点 和 缺点 。 如 上 面 提 到 的 那样 ， 交 换 机 是 即 插 即 用 的 ， 这 是 世界 
上 所 有 超 负 荷 工作 的 网 络 管理 员 都 喜爱 的 特性 。 交 换 机 还 能 够 具有 相对 高 的 分 组 过 滤 和 转 
发 速率 ， 就 像 图 6-24 中 所 示 的 那样 ， 交 换 机 必须 处 理 高 至 第 二 层 的 帧 ， 而 路 由 顺 必 须 处 
理 高 至 第 三 层 的 数据 报 。 在 另 一 方面 ， 为 了 防止 广播 帧 的 循环 ， 交 换 网 络 的 活跃 拓扑 限制 
为 一 棵 生成 树 。 另 外 ， 一 个 大 型 交换 网 络 将 要 求 在 主机 和 路 由 器 中 有 大 的 ARP 表 ， 这 将 
生成 可 观 的 ARP 流量 和 处 理 量 。 而 且 ， 交换机 对 于 广播 风 骏 并 不 提供 任何 保护 措施 ， 即 
如 果 某 主机 出 了 故障 并 传输 出 没完 没 了 的 以 太 网 广播 帧 流 ， 该 交换 机 将 转发 所 有 这 些 帧 ， 
使 得 整个 以 太 网 的 裔 省 。 





图 6-24 在 交换 机 、 路 由 融和 主机 中 分 组 的 处 理 


现在 考虑 路 由 器 的 优点 和 缺点 。 因 为 网 络 寻 址 通常 是 分 层次 的 〈 不 像 MAC 寻 址 那样 
是 扁平 的 ) ， 即 使 当 网 络 中 存在 元 余 路 径 时 ， 分 组 通常 也 不 会 通过 路 由 器 循环 。( 然 而 ， 当 
路 由 器 表 被 误 配 置 时 ， 分 组 可 能 循环 ; 但 是 如 我 们 在 第 4 章 所 知 ， 卫 用 一 个 特殊 的 报 文 首 
部 字段 来 限制 循环 。) 所 以 ， 分 组 就 不 会 被 限制 到 一 棵 生成 树 上 ， 并 可 以 使 用 源 和 目的 地 
之 间 的 最 佳 路 径 。 因 为 路 由 器 没有 生成 树 限 制 ， 所 以 它们 允许 以 丰富 的 拓扑 结构 构建 因 特 
网 ， 例 如 包括 欧洲 和 北美 之 间 的 多 条 活跃 链 路 。 路 由 器 的 另 一 个 特色 是 它们 对 第 二 层 的 广 
播 风 暴 提供 了 防火 墙 保护 。 尽 管 也 许 路 由 融 最 重要 的 缺点 就 是 它们 不 是 即 插 即 用 的 ， 即 路 
由 器 和 连接 到 它们 的 主机 都 需要 人 为 地 配置 P 地 址 。 而 且 路 由 器 对 每 个 分 组 的 处 理 时 间 
通常 比 交 换 机 更 长 ， 因 为 它们 必须 处 理 高 达 第 三 层 的 字段 。 最 后 ， 路 由 器 一 词 有 两 种 不 同 
的 发 音 方 法 ， 或 者 发 音 为 “rootor” 或 发 音 为 “rowter”， 人 们 浪费 了 许多 时 间 争 论 正确 的 
发 音 [Perlman 1999 | 。 > | 

给 出 了 交换 机 和 路 由 器 各 自 具有 的 优点 一 
和 缺点 后 (总结 在 表 6-1 中 ), 一 个 机 构 的 eee  —y% 有 有 
网 络 (例如 ， 大 学 校园 网 或 者 公司 园区 网 ) 即 插 即 用 有 无 有 
什么 时 候 应 该 使 用 交换 机 ， 什 么 时 候 应 该 使 ”优化 路 由 无 有 无 
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用 路 由 器 呢 ? AY, FL R EDLE Me BY h A 2 ae H A JLA is SB DY Be, RE PE Z| 
络 ， 交 换 机 就 足够 了 ， 因 为 它们 不 要 求 IP 地 址 的 任何 配置 就 能 使 流量 局 部 化 并 增加 总 计 
否 吐 量 。 但 是 在 由 几 千 人 台 主 机 组 成 的 更 大 网 络 中 ,通常 在 网 络 中 (除了 交换 机 之 外 ) 还 包 
括 路 由 器 。 路 由 器 提供 了 更 健壮 的 流量 隔离 方式 和 对 广播 风暴 的 控制 ， 并 在 网 络 的 主机 之 
间 使 用 更 “智能 的 ”路 由 。 

对 于 交换 网 络 和 路 由 网 络 的 优 缺 点 的 进一步 讨论 ， 以 及 如 何 能 够 将 交换 局 域 网 技术 扩 
展 为 比 今天 的 以 太 网 容纳 多 两 个 数量 级 以 上 的 主机 ， 参 见 [ Meyers 2004; Kim 2008 ] 。 


6.4.4 虚拟 局 域 网 


在 前 面 图 6-15 的 讨论 中 ， 我 们 注意 到 现代 机 构 的 局 域 网 常常 是 配置 为 等 级 结构 的 ， 
每 个 工作 组 (T) 有 自己 的 交换 局 域 网 ， 经 过 一 个 交换 机 等 级 结构 与 其 他 工作 组 的 交换 
局 域 网 互联 。 虽 然 这 样 的 配置 在 理想 世界 中 能 够 很 好 地 工作 ， 但 在 现实 世界 浓 稼 不 尽 如 人 
意 。 在 图 6-15 中 的 配置 中 ， 能 够 发 现 3 个 缺点 : 
e 缺乏 流量 隔离 。 尽 管 该 等 级 结构 把 组 流量 局 域 化 到 一 个 单一 交换 机 中 ， 但 广播 流 
量 (例如 携带 ARP 和 DHCP 报 文 或 那些 目的 地 还 没有 被 自学 习 交 换 机 学 习 到 的 
W) 仍然 必须 跨越 整个 机 构 网 络 。 限 制 这 些 广播 流量 的 范围 将 改善 局 域 网 的 性 能 。 
也 许 更 为 重要 的 是 ， 为 了 安全 /隐私 的 目的 也 可 能 希望 限制 局 域 网 广播 流量 。 例 
如 ， 如 果 一 个 组 包括 公司 的 行政 管理 团队 ， 另 一 个 组 包括 运行 着 Wireshark 分 组 嗅 
探 器 的 心怀 不 满 的 雇员 ， 网 络 管理 员 也 许 非常 希望 行政 流量 无 法 到 达 该 雇员 的 主 
机 。 通 过 用 路 由 器 代 替 图 6-15 中 的 中 心 交换 机 ， 能 够 提供 这 种 类 型 的 隔离 。 我 们 
很 快 看 到 这 种 隔离 也 能 够 经 过 一 种 交换 (第 二 层 ) 解决 方案 来 取得 。 

© 交换 机 的 无 效 使 用 。 如 果 该 机 构 不 止 有 3 个 组 ， 而 是 有 10 个 组 ， 则 将 要 求 有 10 
个 第 一 级 交换 机 。 如 果 每 个 组 都 较 小 ， 比 如 说 少 于 10 个 人 ， 则 单 台 96 端口 的 交 
换 机 将 足以 容纳 每 个 人 ， 但 这 人 台 单 一 的 交换 机 将 不 能 提供 流量 隔离 。 

e 管理 用 户 。 如 果 一 个 雇员 在 不 同 组 间 移 动 ， 必 须 改变 物理 布线 ， 以 将 该 雇员 连接 
到 图 6-15 中 的 不 同 的 交换 机 上 。 属 于 两 个 组 的 雇员 将 使 问题 更 为 困难 。 

幸运 的 是 ， 这 些 难 题 中 的 每 个 都 能 够 通过 支持 虚拟 局 域 网 (Virtula Local Network, 
VLAN) 的 交换 机 来 处 理 。 顾 名 思 义 ， 支 持 VLAN 的 交换 机 允许 经 一 个 单一 的 物理 局 域 网 
基础 设施 定义 多 个 虚拟 局 域 网 。 在 一 个 VLAN 内 的 主机 彼此 通信 ,仿佛 它们 (并 且 没 有 其 
他 主机 ) 与 交换 机 连接 。 在 一 个 基于 端口 的 VLAN 中 ,交换 机 的 端口 (接口) 由 网 络 管 
理 员 划 分 为 组 。 每 个 组 构成 一 个 VLAN ， 在 每 个 VLAN NH Bos EL TY ae alk 

一 个 端口 的 广播 流量 仅 能 到 达 该 组 中 的 其 他 mre a= 
端口 )。 图 6-25 显示 了 具有 16 个 端口 的 单 
一 交换 机 。 端 口 2 ~ 8 属于 电气 工程 系 
(EE)VLAN， 而 端口 9 ~ 15 属于 计算 机 科学 
系 (CS) VLAN (端口 1 和 16 未 分 配 )。 这 
个 VLAN 解决 了 上 面 提 到 的 所 有 困难 ， 即 
EE VLAN 帧 和 CS VLAN 帧 彼此 隔离 ， 图 6- l l Eee Eee ES 
15 中 的 两 台 交 换 机 已 由 一 台 交 换 机 替代 ， 并 电气 工程 系 计算 机 科学 系 
上 且 在 交换 机 端口 8 的 用 户 加 入 计算 机 科学 系 VLAN N2 = 83 (VLANI S= 15) 
时 ， 网 络 操作 员 只 需 重 新 配置 VLAN 软件 ， 图 6-25 ”配置 了 两 个 VLAN 的 单 台 交换 机 
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使 得 端口 8 与 CS VLAN 相关 联 即 可 。 人 们 容易 想象 到 VLAN 交换 机 配置 和 操作 的 方法 ， 
即 网 络 管理 员 使 用 交换 机 管理 软件 声明 一 个 端口 属于 某 个 给 定 的 VLAN (Hh RE AH K 
口 属于 一 个 默认 的 VLAN) ， 在 交换 机 中 维护 一 张 端口 到 VLAN 的 映射 表 ; 交换 机 软件 仅 
在 属于 相同 VLAN 的 端口 之 间 交 付 帧 。 

但 完全 隔离 两 个 VLAN 带 来 了 新 的 困难 ! 来 自 电 子 工程 系 的 流量 怎样 才能 发 送 到 计算 
机 科学 系 呢 ? 解决 这 个 问题 的 一 种 方式 是 将 VLAN 交换 机 的 一 个 端口 (例如 在 图 6-25 中 
的 端口 1) 与 一 台 外 部 的 路 由 顺 相 连 ， 并 且 将 该 端口 配置 为 属于 EE VLAN 和 CS VLAN, 
在 此 情况 下 ， 即 使 电子 工程 系 和 计算 机 科学 系 共享 相同 的 物理 交换 机 ， 其 逻辑 配置 看 起 来 
也 仿佛 是 电子 工程 系 和 计算 机 科学 系 具有 分 离 的 经 路 由 需 连 接 的 交换 机 。 从 电子 工程 系 发 
往 计算 机 科学 系 的 数据 报 将 首先 跨越 EE VLAN 到 达 路 由 器 ， 然 后 由 该 路 由 器 转发 跨越 CS 
VLAN 到 达 CS 主机 。 幸 运 的 是 交换 机 厂商 使 这 种 配置 变 得 容易 ， 网 络 管理 员 通过 构建 包 
含 一 台 VLAN 交换 机 和 一 台 路 由 器 的 单一 设备 ， 这 样 就 不 再 需要 分 离 的 外 部 路 由 太 了 。 本 
章 后 面 的 课 后 习题 中 更 为 详细 地 探讨 了 这 种 情况 。 

再 次 返回 到 图 6-15 ， 我 们 现在 假设 计算 机 工程 系 没有 分 离开 来 ， 某 些 电子 工程 和 计算 
机 科学 教职员 工 位 于 一 座 建筑 物 中 ， 他 们 当然 需要 网 络 接 人 人， 并且 他 们 和布 望 成 为 他 们 系 
VLAN 的 一 部 分 。 图 6-26 显示 了 第 二 台 8 端口 交换 机 ， 其 中 交换 机 端口 已 经 根据 需要 定义 
为 属于 EE VLAN 或 CS VLAN。 但 是 这 两 台 交换 机 应 当 如 何 互 联 呢 ? 一 种 容易 的 解决 方案 
是 在 每 台 交 换 机 上 定义 一 个 属于 CS VALN 的 端口 (对 EE VLAN 也 类 似 处 理 ) ， 并 且 如 
图 6-26a 所 示 将 这 两 个 端口 彼此 互联 起 来 。 然 而 ， 这 种 解决 方案 不 具有 扩展 性 ， 因 为 在 每 
台 交 换 机 上 NN 个 VLAN 将 要 求 NN 个 端口 直接 互联 这 两 台 交 换 机 。 
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图 6-26 ”连接 具有 两 个 VLAN 的 两 台 VLAN 交换 机 


一 种 更 具 扩 展 性 互联 VLAN 交换 机 的 方法 称 为 VLAN 干线 连接 (VLAN trunking)。 在 
图 6-26b 所 示 的 VLAN 干线 方法 中 ， 每 台 交 换 机 上 的 一 个 特殊 端口 〈 左 侧 交 换 机 上 的 端口 
16 ， 右 侧 交换 机 上 的 端口 1) 被 配置 为 干线 端口 ， 以 互联 这 两 台 VLAN 交换 机 。 该 干线 端 
口 属于 所 有 VLAN ， 发 送 到 任何 VLAN 的 帧 经 过 干线 链 路 转发 到 其 他 交换 机 。 但 这 会 引起 
另外 的 问题 : 一 个 交换 机 怎样 知道 到 达 干 线 端 口 的 帧 属于 某 个 特定 的 VLAN 呢 ?IEEE 定 


义 了 一 种 扩展 的 以 太 网 帧 格式 一 一 802. 1Q， 用 于 跨越 VLAN 干线 的 帧 。 如 图 6-27 中 所 示 ， 
802. 1Q 帧 由 标准 以 太 网 帧 与 加 进 首部 的 4 字 节 VLAN 标签 (VLAN tag) 组 成 ， 而 VLAN 
标签 承载 着 该 帧 所 属 的 VLAN 标识 符 。VLAN 标签 由 在 VLAN 干线 发 送 侧 的 交换 机 加 进 帧 
中 ， 解 析 后 并 由 在 VLAN 干线 接收 侧 的 交换 机 删除 。VLAN 标签 自身 由 一 个 2 字 节 的 标签 
协议 标识 符 (Tag Protocol Identifier, TPID) 字段 (具有 固定 的 十 六 进 制 值 81-00) 、 一 个 2 
字 节 的 标签 控制 信息 字段 (包含 一 个 12 比特 的 VLAN 标识 符 字段 ) 和 一 个 3 比特 优先 权 
字段 (具有 类 似 于 IP 数据 报 TOS 字段 的 目的 ) 组 成 。 


类 型 
前 序 码 ”目的 地 址 ” 源 地 址 数据 A eh 
3 | “~、、 类 型 Si 
| | ne : "i 
前 序 码 目的 地 址 ” 源 地 址 数据 CRC’ 
[标签 控制 信息 | 
| 标签 协议 标识 符 重 计算 的 CRT 


图 6-27 初始 的 以 太 网 帧 (ERR), ，802. 1Q 标签 以 太 网 VLAN Wi (下 部 ) 


在 这 部 分 讨论 中 ， 我 们 仅仅 简要 地 涉及 了 VLAN， 关 注 了 基于 端口 的 VLAN。 我 们 也 
应 当 提 及 VLAN 能 够 以 几 种 其 他 方式 定义 。 在 基于 MAC 的 VLAN 中 ， 网 络 管理 员 指 定 属 
于 每 个 VLAN 的 MAC 地 址 的 集合 ; 无 论 何 时 一 个 设备 与 一 个 端口 连接 时 ， 端 口 基 于 设备 
的 MAC 地 址 将 其 连接 进 适当 的 VLAN. VLAN 也 能 基于 网 络 层 协议 (例如 IPv4、IPv6 或 
Appletalk) 和 其 他 准则 进行 定义 。VLAN 跨越 IP 路 由 需 扩 展 也 是 可 能 的 ， 这 使 得 多 个 LAN 
孤岛 能 被 连接 在 一 起 ， 以 形成 能 够 跨越 全 局 的 单一 LAN [Yu 2011]。 详 情 请 参见 802. 1Q 
标准 [IEEE 802. 1q 2005], 


6.5 链 路 虚拟 化 : 网 络 作为 链 路 层 


因为 本 章 关 注 链 路 层 协 议 ， 所 以 在 我 们 临近 该 章 结束 的 时 候 ， 让 我 们 反思 一 下 对 已 经 
演化 的 词汇 链 路 的 理解 。 在 本 章 开 始 时 ,我 们 将 链 路 视 为 连接 两 台 通 信 主 机 的 物理 线路 。 
在 学 习 多 路 访问 协议 时 ,我们 看 到 了 多 台 主 机 能 够 通过 一 条 共享 的 线路 连接 起 来 ， 并且 连 
接 主 机 的 这 种 “线路 ”能 够 是 无 线 电 频谱 或 其 他 媒体 。 这 使 我 们 将 该 链 路 更 多 地 抽象 为 一 
条 信道 ， 而 不 是 作为 一 条 线路 。 在 我 们 学 习 以 太 局 域 网 时 (图 6-15)， 我 们 看 到 互联 媒体 
实际 上 能 够 是 一 种 相当 复杂 的 交换 基础 设施 。 然 而 ， 经 过 这 种 演化 ， 主 机 本 身 维持 着 这 样 
的 视图 ， 即 互联 媒体 只 是 连接 两 台 或 多 台 主 机 的 链 路 层 信 道 。 我 们 看 到 ， 例 如 一 台 以 太 网 
主机 不 知道 它 是 通过 单一 短 局 域 网 网 段 〈 图 6-17) 还 是 通过 地 理 上 分 布 的 交换 局 域 网 
(图 6-15) 或 通过 VLAN 与 其 他 局 域 网 主机 进行 连接 ， 这 是 很 幸福 的 事 。 

在 两 台 主 机 之 间 由 拨号 调制 解 调 大 连接 的 场合 ， 连 接 这 两 台 主 机 的 链 路 实际 上 是 电话 
网 ， 这 是 一 个 人 逻辑 上 分 离 的 、 全 球 性 的 电信 和 网络 ， 它 有 自己 的 用 于 数据 传输 和 信 令 的 交换 
机 、 链 路 和 协议 栈 。 然 而 ， 从 因特网 链 路 层 的 观点 看 ， 通 过 电话 网 的 拨号 连接 被 看 作 一 根 
简单 的 “线路 " 。 在 这 个 意义 上 ， 因 特 网 虚拟 化 了 电话 网 ， 将 电话 网 看 成 为 两 台 因 特 网 主 
机 之 间 提 供 链 路 层 连接 的 链 路 层 技 术 。 你 可 能 回想 起 在 第 2 章 中 对 于 和 覆盖 网 络 的 讨论 ， 类 
似 地 ， 一 个 覆盖 网 络 将 因特网 视 为 为 覆盖 节点 之 间 提 供 连接 性 的 一 种 手段 ， 寻 求 以 因特网 
绑 盖 电 话 网 的 相同 方式 来 绑 盖 因特网 。 
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在 本 节 中 ， 我们 将 考虑 多 协议 标签 交换 (MPLS) 网 络 。 与 电路 交换 的 电话 网 不 同 ， 

MPLS 客观 上 讲 是 一 种 分 组 交换 的 虚 电路 网 络 。 它 们 有 目 己 的 分 组 格式 和 转发 行为 。 因 此 ， 
从 教学 法 的 观点 看 ， 有 关 MPLS 的 讨论 既 适 合 放 在 网 络 层 的 学 习 中 ,也 适合 放 在 链 路 层 的 
学 习 中 。 然 而 ， 从 因特网 的 观点 看 ， 我 们 能 够 认为 MPLS 像 电 话 网 和 交换 以 太 网 一 样 ， 作 
KA IP 设备 提供 互联 服务 的 链 路 层 技 术 。 因 此 ， 我 们 将 在 链 路 层 讨论 中 考虑 MPLS, 
继 和 ATM 网 络 也 能 用 于 互联 下 设备 ， 虽 然 这 些 技术 看 上 去 有 些 过 时 〈 但 仍 在 部 署 ) , 
里 将 不 再 讨论 ; 详情 请 参见 一 本 可 读 性 强 的 书 | Goralski 1999 | 。 我 们 对 MPLS 的 讨 t as 
简明 扼要 的 ， 因 为 有 关 这 些 网 络 每 个 都 能 够 写 〈 并 且 已 经 写 了 ) BAA. AK MPLS 详情 
我 们 推荐 [Davie 2000 ] 。 我 们 这 里 主要 关注 这 些 网 络 怎样 为 互联 正 设 备 提供 服务 ， 尽 管 
我 们 也 将 更 深入 一 些 探讨 支撑 基础 技术 。 


多 协议 标签 交换 


多 协议 标签 交换 ( Multiprotocol Label Switching, MPLS) 目 20 世纪 90 年代 中 后 期 在 一 
些 产 业界 的 努力 下 进行 演化 ， 以 改善 IP 路 由 器 的 转发 速度 。 它 采用 来 自 虚 电路 网 络 领 域 
的 一 个 关键 概念 : 固定 长 度 标签 。 其 目标 是 : 对 于 基于 固定 长 度 标签 和 虚 电路 的 技术 ， 在 
不 放弃 基于 目的 地 IP 数据 报 转发 的 基础 设施 的 前 提 下 ， 当 可 能 时 通过 选择 性 地 标识 数据 
报 并 允许 路 由 器 基于 固定 长 度 的 标签 (而 不 是 目的 地 卫 地 址 ) 转发 数据 报 来 增强 其 功能 。 
重要 的 是 ， 这 些 技术 与 协同 工作 ， 使 用 IP 寻 址 和 路 由 选择 。IETF 在 MPLS 协议 中 统一 
TÈR [RFC 3031; RFC 3032 ] ， 有 效 地 将 虚 电 路 (VC) 技术 综合 进 了 路 由 选择 的 
数据 报 网 络 。 

首先 考虑 由 MPLS 使 能 的 路 由 器 处 理 的 链 路 层 帧 格式 ， 以 此 开始 学 习 MPLS. [Al 6-28 
显示 了 在 MPLS 使 能 的 路 由 器 之 间 传 输 的 一 个 链 路 层 帧 ， 该 帧 具有 一 个 小 的 MPLS 首部 ， 
该 首部 增加 到 第 二 层 (如 以 太 网 ) 首部 和 第 三 层 ( 即 IP) 首部 之 间 。RFC 3032 定义 了 用 
于 这 种 链 路 的 MPLS 首部 的 格式 ; 用 于 ATM 和 帧 中 继 网 络 的 首部 也 定义 在 其 他 的 RFC 文 
档 中 。 包 括 在 MPLS 首部 中 的 字段 是 : 标签 ; 预 留 的 3 比特 实验 字段 ; 1 比特 S 字段 ， 用 
于 指示 一 系列 ba i MPLS di (我 们 这 里 不 讨论 这 个 商 级 主题) 寿命 字段 。 


都 ”MPLS 首部 了 首部 链 路 层 由 的 其 余部 分 
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图 6-28 MPLS 首部 : 位 于 链 路 层 和 网 络 层 首 部 之 间 


从 图 6-28 立即 能 够 看 出 ， 一 个 MPLS 加 强 的 帧 仅 能 在 两 个 均 为 MPLS 使 能 的 路 由 器 之 
间 发 送 。( 因为 一 个 非 MPLS 使 能 的 路 由 器 ， 当 它 在 期 望 发 现 下 首部 的 地 方 发 现 了 一 个 
MPLS 首部 时 会 相当 混 清 !) 一 个 MPLS 使 能 的 路 由 器 常 被 称 为 标签 交换 路 由 器 ( label- 
switched router) ， 因 为 它 通 过 在 其 转发 表 中 查找 MPLS 标签 ， 然 后 立即 将 数据 报 传递 给 适 
当 的 输出 接口 来 转发 MPLS 帧 。 因 此 ，MPLS 使 能 的 路 由 器 不 需要 提取 目的 IP 地 址 和 在 转 
发 表 中 执行 最 长 前 缀 匹 配 的 查找 。 但 是 路 由 器 怎样 才能 知道 它 的 邻居 是 否 的 确 是 MPLS 使 
能 的 呢 ? 路 由 器 如 何 知道 哪个 标签 与 给 定 P 目的 地 相 联系 呢 ? 为 了 回答 这 些 问 题 ， 我 们 
需要 看 看 一 组 MPLS 使 能 路 由 器 之 间 的 交互 过 程 。 

在 图 6-29 所 示 的 例子 中 ， 路 由 器 R1 到 R4 都 是 MPLS 使 能 的 ，R5 和 R6 是 标准 的 IP 
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路 由 器 。Rl 向 R2 和 R3 通告 了 它 (R1) 能 够 路 由 到 目的 地 A, IF HAA MPLS 标签 6 的 
接收 帧 将 要 转发 到 目的 地 A。 路 由 器 R3 已 经 各 路 由 器 R4 通告 了 它 能 够 路 由 到 目的 地 A 和 
D， 分 别 具 有 MPLS 标签 10 和 12 的 人 帧 将 朝 着 这 些 目的 地 交换 。 路 由 器 R2 也 回路 由 器 
R4 通告 了 它 (R2) 能 够 到 达 目 的 地 A， 具 有 MPLS 标签 8 的 接收 帧 将 朝 着 A 交换 。 注 意 
到 路 由 器 R4 现在 处 于 一 个 到 达 A 且 有 两 个 MPLS 路 径 的 令 人 感 兴趣 的 位 置 上 ， 经 接口 0 
具有 出 MPLS 标签 10， 经 接口 1 具有 出 MPLS 标签 8。 在 图 6-29 中 男 出 的 外 围 部 分 是 中 设 
fr R5、R6、A 和 DD， 它 们 经 过 一 个 MPLS 基础 设施 (MPLS 使 能 路 由 器 R1, R2, R3 和 
R4) 连接 在 一 起 ， 这 与 一 个 交换 局 域 网 或 ATM 网 络 能 够 将 IP 设备 连接 到 一 起 的 方式 十 分 
相似 。 并 且 与 交换 局 域 网 或 ATM 网 络 相 似 ，MPLS 使 能 路 由 器 R1 到 R4 完成 这 些 工 作 时 


从 没有 接触 分 组 的 IP 首部 。 
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图 6-29 MPLS 增强 的 转发 


在 我 们 上 面 的 讨论 中 ， 我 们 并 没有 指定 在 MPLS 使 能 路 由 器 之 间 分 布 标签 的 特定 协 
议 ， 因 为 该 信 令 的 细节 已 经 超出 了 本 书 的 范围 。 然 而 ， 我们 注意 到 ，IETF 的 MPLS 工作 组 
已 经 在 [RFC 3468] 中 定义 了 RSVP 协议 的 一 种 扩展 ， 称 之 为 RSVP-TE[ RFC 3209], € 
将 关注 对 MPLS 信 令 所 做 的 工作 。 我 们 也 不 讨论 MPLS 实际 上 是 如 何 计 算 在 MPLS 使 能 路 
由 器 之 间 分 组 的 路 径 的 ， 也 不 讨论 它 如 何 收 集 链 路 状态 信息 〈 例 如 ， 未 由 MPLS 预 留 的 链 
路 带宽 量 ) 以 用 于 这 些 路 径 计算 中 。 现 有 的 链 路 状态 路 由 选择 算法 (例如 OSPF) CAT 
展 为 向 MPLS 使 能 路 由 器 “法 泛 ”。 令 人 感 兴 趣 的 是 ， 实 际 路 径 计 算 算法 没有 标准 化 ， 它 
们 当前 是 厂商 特定 的 算法 。 

至 今 为 止 ， 我们 关于 MPLS 的 讨论 重点 基于 这 样 的 事实 ，MPLS 基于 标签 执行 交换 ， 
而 不 必 考 虑 分 组 的 IP 地 址 。 然 而，MPLS 的 真正 优点 和 当前 对 MPLS 感 兴趣 的 原因 并 不 在 
于 交换 速度 的 潜在 增加 ， 而 在 于 MPLS 使 能 的 新 的 流量 管理 能 力 。 如 前 面 所 述 ，R4 到 A 
具有 两 条 MPLS 路 径 。 如 果 转 发 在 IP 层 基 于 IP 地 址 执行 ， 我们 在 第 4 章 中 学 习 的 IP 路 由 
选择 协议 将 只 指定 到 A 的 单一 最 小 费用 的 路 径 。 所 以 ，MPLS 提供 了 沿 着 多 条 路 由 转发 分 
组 的 能 力 ， 使 用 标准 IP 路 由 选择 协议 这 些 路 由 将 是 不 可 能 的 。 这 是 使 用 MPLS 的 一 种 简单 
形式 的 流量 工程 (traffic engineering)[ RFC 3346; RFC3272; RFC 2702; Xiao 2000], ， 其 中 
网 络 运行 者 能 够 超越 普通 的 IP 路 由 选择 ， 迫 使 某 些 流量 沿 着 一 条 路 径 朝 着 某 给 定 的 目的 
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地 引导 ， 并 且 朝 着 相同 目的 地 的 其 他 流量 治 着 另 一 条 路 径流 动 (无 论 是 由 于 策略 、 性 能 或 
某 些 其 他 原因 ) 。 

将 MPLS 用 于 其 他 目的 也 是 可 能 的 。 能 用 于 执行 MPLS 转发 路 径 的 快速 恢复 ， 例 如 ， 
经 过 一 条 预计 算 的 无 故障 路 径 重 路 由 流量 来 对 链 路 故障 做 出 反应 [Kar 2000; Huang 2002 ; 
RFC 3469 |] 。 最 后 ， 我 们 注意 到 MPLS 能 够 并 且 已 经 被 用 于 实现 所 谓 虚 拟 专用 网 ( Virtual 
Private Network ，VPN ) 。 在 为 用 户 实 现 一 个 VPNR 的 过 程 中 ，ISP 使 用 它 的 MPLS 使 能 网 络 
将 用 户 的 各 种 网 络 连接 在 一 起 。MPLS 能 被 用 于 将 资源 和 由 用 户 的 VPN 使 用 的 寻 址 方式 相 
隔离 ， 其 他 用 户 利用 该 VPN 跨越 该 ISP 网 络 ， 详 情 参 见 [ DeClercq 2002]. 

这 里 有 关 MPLS 的 讨论 是 简要 的 ， 我 们 鼓励 读者 查阅 我 们 提 到 的 这 些 文献 。 我 们 注意 
到 对 MPLS 有 许多 可 能 的 用 途 ， 看 起 来 它 将 迅速 成 为 因特网 流量 工程 的 瑞士 军刀 | 


6.6 数据 中 心 网 络 


近年 来 ， 因 特 网 公司 如 谷歌 、 微 软 、 脸 书 (Facebook) 和 亚马逊 (以 及 它们 在 亚洲 和 
欧洲 的 同行 ) 已 经 构建 了 大 量 的 数据 中 心 。 每 个 数据 中 心 都 容纳 了 数 万 至 数 十 万 台 主 机 ， 
并 且 同 时 支持 着 很 多 不 同 的 云 应 用 (例如 搜索 、 电 子 邮件 、 社 交 网 络 和 电子 商务 )。 每 个 
数据 中 心 都 有 目 己 的 数据 中 心 网 络 (data center network)， 这 些 数据 中 心 网 络 将 其 内 部 主 
机 彼此 互联 并 与 因特网 中 的 数据 中 心 互联 。 在 本 节 中 ,我 们 简要 介绍 用 于 云 应 用 的 数据 中 
心 网 络 。 

大 型 数据 中 心 的 投资 巨大 ， 一 个 有 100 000 台 主 机 的 数据 中 心 每 个 月 的 费用 超过 1200 
万 美元 | Greenberg 2009a] 。 在 该 费用 中 ， 用 于 主机 自身 的 开销 占 4$% (每 3 ~4 年 需要 更 
新 一 次 ); 变压器 、 不 间断 电源 系统 、 长 时 间断 电 时 使 用 的 发 电机 以 及 冷却 系统 等 基础 设 
施 的 开销 占 25% ; 用 于 功 耗 的 电力 设施 的 开销 占 15% ; 用 于 联网 的 开销 占 15% ， 这 包括 
了 网 络 设备 (交换 机 、 路 由 器 和 人 负载 均衡 设备 ) 、 外 部 链 路 以 及 传输 流量 的 开销 。 (在 这 
些 比例 中 ,设备 费用 是 分 期 偿还 的 ， 因 此 费用 通常 是 由 一 次 性 购 半 和 持续 开销 〈 如 能 耗 ) 
构成 的 。) 尽管 联网 不 是 最 大 的 费用 ， 但 是 网 络 创新 是 减少 整体 成 本 和 性 能 最 大 化 的 关键 
| Greenberg 2009a | 。 

主机 就 像 是 数据 中 心 的 工蜂 : 它们 负责 提供 内 容 〈 例 如， 网 页 和 视频 ) ， 存 储 邮 件 和 
文档 ， 并 共同 执行 大 规模 分 布 式 计 算 (例如 ， 为 搜索 引 警 提供 分 布 式 索引 计算 )。 数 据 中 
心中 的 主机 称 为 刀片 (blade), SOB ORR ARI, 一般 是 包括 CPU 、 内 存 和 磁盘 存储 的 商 
用 主机 。 主 机 被 堆 苹 在 机 架 上 ， 每 个 机 架 一 般 堆 放 20 ~ 40 台 刀 片 。 在 每 一 个 机 染 顶 部 有 
一 台 交 换 机 ， 这 台 交 换 机 被 形象 地 称 为 机 架 顶 部 (Top of Rack, TOR) 交换 机 ， 它 们 与 机 
架 上 的 主机 互联 ， 并 与 数据 中 心中 的 其 他 交换 机 互联 。 具 体 来 说 ， 机 架 上 的 每 台 主 机 都 有 
一 块 与 TOR 交换 机 连接 的 网 卡 ， 每 台 TOR 交换 机 有 额外 的 端口 能 够 与 其 他 TOR 交换 机 连 
接 。 目 前 主机 通常 用 40Gbps 的 以 太 网 连接 到 它们 的 TOR 交换 机 | Greenberg 2015 ] 。 每 台 
主机 也 会 分 配 一 个 自己 的 数据 中 心 内 部 的 IP 地址 。 

数据 中 心 网 络 文 持 两 种 类 型 的 流量 : 在 外 部 客户 与 内 部 主机 之 间 流 动 的 流量 ， 以 及 内 
部 主机 之 间 流 动 的 流量 。 为 了 处 理 外 部 客户 与 内 部 主机 之 间 流 动 的 流量 ， 数 据 中 心 网 络 包 
括 了 一 台 或 者 多 台 边 界 路 由 器 (border router) ， 它 们 将 数据 中 心 网 络 与 公共 因特网 相连 。 
数据 中 心 网 络 因此 需要 将 所 有 机 架 彼 此 互联 ， 并 将 机 架 与 边界 路 由 带 连 接 。 图 6-30 显示 
了 一 个 数据 中 心 网 络 的 例子 。 数 据 中 心 网 络 设计 (data center network design) 是 互联 网 络 
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和 协议 设计 的 艺术 ， 该 艺术 专注 于 机 架 彼此 连接 和 与 边界 路 由 和 硕 相 连 。 近 年 来 ， 数 据 中 心 
网 络 的 设计 已 经 成 为 计算 机 网 络 研 究 的 重要 分 文 | Al-Fares 2008; Greenberg 2009a; 
Greenberg 2009b; Mysore 2009; Guo 2009; Wang 2010]. 





图 6-30 具有 等 级 拓扑 的 数据 中 心 网 络 


1. 负载 均衡 

一 个 云 数据 中 心 ， 如 一 个 谷歌 或 者 微软 的 数据 中 心 ， 能 够 同时 提供 诸如 搜索 、 电 子 邮 
件 和 视频 应 用 等 许多 应 用 。 为 了 支持 来 自 外 部 客户 的 请 求 ， 每 一 个 应 用 都 与 一 个 公开 可 见 
的 IP 地址 关联 ， 外 部 用 户 向 该 地 址 发 送 其 请 求 并 从 该 地 址 接收 啊 应 。 在 数据 中 心 内 部 ， 
外 部 请 求 首先 被 定向 到 一 个 负载 均衡 器 (load balancer), MARIMAR ER E ENDE 
请 求 ， 以 主机 当前 的 负载 作为 函数 来 在 主机 之 间 均 衡 负 和 载 。 一 个 大 型 的 数据 中 心 通常 会 有 
几 台 负载 均衡 器 ， 每 台 服 务 于 一 组 特定 的 云 应 用 。 由 于 负载 均衡 希 基 于 分 组 的 目的 闪 口 号 
(第 四 层 ) 以 及 目的 IP 地址 做 决策 ， 因 此 它们 常 被 称 为 “第 四 层 交 换 机 ”。 一旦 接收 到 一 
个 对 于 特定 应 用 程序 的 请 求 ， 负 载 均 衡器 将 该 请 求 分 发 到 处 理 该 应 用 的 某 一 台 主 机 上 (该 
主机 可 能 再 调用 其 他 主机 的 服务 来 协助 处 理 该 请 求 ) 。 当 主机 处 理 完 该 请 求 后 ， 向 负载 均 
衡器 回 送 响 应 ， 再 由 负载 均衡 器 将 其 中 继 发 回 给 外 部 客户 。 负 载 均 衡 希 不 仅 平 衡 主 机 间 的 
工作 负载 ， 而 且 还 提供 类 似 NAT 的 功能 ， 将 外 部 IP 地 址 转换 为 内 部 适当 主机 的 IP 地 址 ， 
然后 将 反方 向 流 问 客户 的 分 组 按照 相反 的 转换 进行 处 理 。 这 防止 客户 直接 接触 主机 ， 从 而 
具有 隐藏 网 络 内 部 结构 和 防止 客户 直接 与 主机 交互 等 安全 性 益处 。 

2. 等 级 体系 结构 

对 于 仅 有 数 千 台 主 机 的 小 型 数据 中 心 ， 一 个 简单 的 网 络 也 许 就 足够 了 了 。 这 种 简单 网 络 
由 一 台 边 界 路 由 器 、 一 台 负 载 均 衡 锅 和 几 十 个 机 架 组 成 ， 这 些 机 架 由 单一 以 太 网 交换 机 进 
行 互联 。 但 是 当主 机 规模 扩展 到 几 万 至 几 十 万 的 时 候 ， 数 据 中 心 通 常 应 用 路 由 器 和 交换 机 
等 级 结构 (hierarchy of router and switch) ， 图 6-30 显示 了 这 样 的 拓扑 。 在 该 等 级 结构 的 顶 
端 ， 边 界 路 由 器 与 接 人 路 由 器 相连 (在 图 6-30 中 仅仅 显示 了 两 台 ， 但 是 能 够 有 更 多 ) 。 在 
每 台 接 入 路 由 器 下 面 ， 有 3 层 交 换 机 。 每 台 接 人 路 由 器 与 一 台 第 一 层 交 换 机 相连 ， 每 台 第 
一 层 交 换 机 与 多 台 第 二 层 交 换 机 以 及 一 台 负 载 均衡 器 相连 。 每 台 第 二 层 交 换 机 又 通过 机 染 
的 TOR 交换 机 (第 三 层 交 换 机 ) 与 多 个 机 架 相 连 。 所 有 链 路 通常 使 用 以 太 网 作为 链 路 层 
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和 物理 层 协议 ， 并 混合 使 用 铜 缆 和 光缆 。 通 过 这 种 等 级 式 设 计 ， 可 以 将 数据 中 心 扩展 到 几 
十 万 台 主 机 的 规模 。 

因为 云 应 用 提供 商 持续 地 提供 高 可 用 性 的 应 用 是 至 关 重 要 的 ， 所 以 数据 中 心 在 它们 的 
设计 中 也 包含 了 元 余 网 络 设备 和 元 余 链 路 (在 图 6-30 中 没有 显示 出 来 ) 。 例 如 ， 每 台 TOR 
交换 机 能 够 与 两 台 第 二 层 交 换 机 相连 ， 每 台 接 和 人 路由器、 第 一 层 交 换 机 和 第 二 层 交 换 机 可 
以 元 余 并 集成 到 设计 中 [Cisco 2012; Greenberg 2009b ] 。 在 图 6-30 中 的 等 级 设计 可 以 看 
到 ， 每 台 接 人 路 由 器 下 的 这 些 主机 构成 了 单一 子 网 。 为 了 使 ARP 广播 流量 本 地 化 ， 这 些 
子 网 的 每 个 都 被 进一步 划分 为 更 小 的 VLAN 子 网 ， 每 个 由 数 百 台 主 机 组 成 [ Greenberg 
2009a | 。 

尽管 刚才 描述 的 传统 的 等 级 体系 结构 解决 了 扩展 性 问题 ， 但 是 依然 存在 主机 到 主机 容 
量 受 限 的 问题 [Greenberg 2009b] 。 为 了 理解 这 种 限制 ， 重 新 考虑 图 6-30， 并 且 假 设 每 台 
主机 用 1Gbps 链 路 连接 到 它 的 TOR 交换 机 ， 而 交换 机 间 的 链 路 是 10Gbps 的 以 太 网 链 路 。 
在 相同 机 架 中 的 两 台 主机 总 是 能 够 以 1Gbps 全 速 通信 ， 而 只 受 限于 主机 网 络 接口 卡 的 速 
率 。 然 而 ， 如 果 在 数据 中 心 网络 中 同时 存在 多 条 并 发 流 ， 则 不 同 机 架 上 的 两 台 主机 间 的 最 
大 速率 会 小 得 多 。 为 了 深入 理解 这 个 问题 ， 考 虑 不 同 机 架 上 的 40 对 不 同 主机 间 的 40 条 并 
发 流 的 情况 。 具 体 来 说 ， 假 设 图 6-30 中 机 架 1 上 10 台 主 机 都 向 机 架 5 上 对 应 的 主机 发 送 
一 条 流 。 类 似 地 ， 在 机 架 2 和 机 架 6 的 主机 对 上 有 10 条 并 发 流 ， 机 架 3 和 机 架 7 间 有 10 
条 并 发 流 ， 机 架 4 和 机 架 8 间 也 有 10 条 并 发 流 。 如 果 每 一 条 流 和 其 他 流 经 同一 条 链 路 的 
流 平 均 地 共享 链 路 容量 ， 则 经 过 10Gbps 的 A 到 B 链 路 (以 及 10Gbps 的 B 到 C H) 的 
40 条 流 中 每 条 流 获得 的 速率 为 10Cbps/40 =250Mbps， 显 著 小 于 1Gbps 的 网 络 接口 卡 速率 。 
如 果 主 机 间 的 流量 需要 穿 过 该 等 级 结构 的 更 高 层 ， 这 个 问题 会 变 得 更 加 严重 。 对 这 个 限制 
的 一 种 可 行 的 解决 方案 是 部 署 更 高 速率 的 交换 机 和 路 由 器 。 但 是 这 会 大 大 增加 数据 中 心 的 
费用 ， 因 为 具有 高 接口 速率 的 交换 机 和 路 由 器 是 非常 昂贵 的 。 

因为 数据 中 心 的 一 个 关键 需求 是 放置 计算 和 服务 的 灵活 性 ， 所 以 支持 主机 到 主机 的 高 
带宽 通信 十 分 重要 | Greenberg 200b; Farrington 2010 | 。 例 如 ， 一 个 大 规模 的 因特网 搜索 
引擎 可 能 运行 在 跨越 多 个 机 架 的 上 千 台 主机 上 ， 在 所 有 主机 对 之 间 具 有 极 高 的 带宽 要 求 。 
类 似 地 ， 像 EC2 这 样 的 云 计 算 服务 可 能 硕 望 将 构成 用 户 服务 的 多 台 虚 拟 机 运行 在 具有 最 大 
容量 的 物理 主机 上 ， 而 无 须 考虑 它们 在 数据 中 心 的 位 置 。 如 果 这 些 物理 主机 跨越 了 多 个 机 
架 ， 前 面 描述 的 网 络 瓶 颈 可 能 会 导致 性 能 不 佳 。 

3. 数据 中 心 网 络 的 发 展 趋势 


为 了 降低 数据 中 心 的 费用 ， 同 时 提高 其 在 时 延 和 吞吐 量 上 的 性 能 ， 因 特 网 云 服务 巨头 
如 谷歌 、 脸 书 、 亚 马 和 进 和 微软 都 在 不 断 地 部 署 新 的 数据 中 心 网 络 设计 方案 。 尽 管 这 些 设计 
方案 都 是 专 有 的 ， 但 是 许多 重要 的 趋势 是 一 样 的 。 

其 中 的 一 个 趋势 是 部 署 能 够 克服 传统 等 级 设计 缺陷 的 新 型 互联 体系 结构 和 网 络 协议 。 
一 种 方法 是 采用 全 连接 拓扑 (fully connected topology) 来 蔡 代 交换 机 和 路 由 器 的 等 级 结构 
[ Facebook 2014; Al- Fares 2008; Greenberg 2009b; Guo 2009 | ， 图 6-31 中 显示 了 这 种 拓 
扑 。 在 这 种 设计 中 ,每 台 第 一 层 交 换 机 都 与 所 有 第 二 层 交 换 机 相连 ， 因 此 : 岂 主 机 到 主机 
的 流量 绝 不 会 超过 该 交换 机 层次 ; DHF 台 第 一 层 交 换 机 ， 在 任意 两 台 二 层 交 换 机 间 有 
n 条 不 相交 的 路 径 。 这 种 设计 可 以 显著 地 改善 主机 到 主机 的 容量 。 为 了 理解 该 问题 ， 重 新 
考虑 40 条 流 的 例子 。 图 6-31 中 的 拓扑 能 够 处 理 这 种 流 模式 ， 因 为 在 第 1 台 第 二 层 交 换 机 
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和 第 2 台 第 二 层 交 换 机 间 存 在 4 条 不 相交 的 路 径 ， 可 以 一 起 为 前 两 台 第 二 层 交 换 机 之 间 提 
供 总 和 为 40Gbps 的 聚合 容量 。 这 种 设计 不 仅 减 轻 了 主机 到 主机 的 容量 限制 ， 同 时 创建 了 
一 种 更 加 灵活 的 计算 和 服务 环境 。 在 这 种 环境 中 ， 任 何 未 连接 到 同一 台 交 换 机 的 两 个 机 加 
之 间 的 通信 在 逻辑 上 是 等 价 的 ， 而 不 论 其 在 数据 中 心 的 位 置 如 何 。 

2 me Rm JA 第 一 层 交 换 机 

| ee | 

Ea pad pad [> 第 二 层 交换 机 


= (sh Sh Sh [Eh Ssh [Fay Ssh sh Ssh Ssh Ssh ES Ssh 上 sn Soh TOR ZAL 


服务 器 机 加 


416-31 高 度 互联 的 数据 网 络 拓 扑 


另外 一 个 主要 的 趋势 就 是 采用 基于 船 运 集装箱 的 模块 化 数据 中 心 ( Modular Data 
Center, MDC) [ You Tube 2009; Waldrop 2007 ] 。 在 一 个 MDC 中 ， 在 一 个 标准 的 12 米 船 
运 集装箱 内 ， 工 厂 构 建 一 个 “迷你 数据 中 心 ”并 将 该 集装箱 运送 到 数据 中 心 的 位 置 。 每 
一 个 集装箱 都 有 多 达 数 干 台 主机 ， 堆 放 在 数 十 台 机 架 上 ， 并 且 紧 密 地 排列 在 一 起 。 在 数 
据 中 心 位 置 ， 多 个 集装箱 彼此 互联 ， 同 时 也 和 因特网 连接 。 一 旦 预制 的 集装箱 部 署 在 数 
据 中 心 ， 通 常 难以 检修 。 因 此 ， 每 一 个 集装箱 都 得 体 地 设计 为 性 能 下 降 : 当 组 件 〈 服 务 
器 和 交换 机 ) 随 着 时 间 的 推移 出 现 故 障 时 ， 集 装 箱 继续 运行 但 是 性 能 下 降 。 当 许多 组 件 
出 现 故障 并 且 性 能 已 经 下 降 到 低 于 某 个 国 值 时 ， 整 个 集装箱 将 会 被 移 除 ， 并 用 新 的 来 
GELT 

创建 由 集装箱 构成 的 数据 中 心 提出 了 新 的 联网 挑战 。 对 于 MDC， 有 两 种 类 型 的 网 络 : 
每 一 个 集装箱 中 的 内 部 网 络 和 互联 每 个 集装箱 的 核心 网 络 [Cuo 2009; Farrington 2010 ] 。 
在 每 个 集装箱 内 部 ， 在 规模 上 升 到 数 千 台 主机 的 时 候 ， 通 过 廉价 的 商用 吉 比 特 以 太 网 交换 
机 创建 全 连接 的 网 络 ( 如 前 面 所 描述 ) 是 可 行 的。 然而 ， 核 心 网 络 的 设计 仍然 是 一 个 种 有 
挑战 性 的 问题 ， 这 需要 能 互联 成 日 上 千 的 集装箱 ， 同 时 能 够 为 典型 工作 负载 提供 路 多 个 集 
装 箱 的 主机 到 主机 间 的 高 带宽 。 | Farrington 2010] 中 提出 了 一 种 互联 集装箱 的 混合 电 / 光 
交换 机 体系 结构 。 

当 采 用 高 度 互联 拓扑 的 时 候 ， 一 个 主要 的 问题 是 设计 交换 机 之 间 的 路 由 选择 算法 。 一 
种 可 能 是 采用 随机 路 由 选择 方式 | Greenberg 2009b ]。 为 一 种 可 能 是 在 每 台 主 机 中 部 署 多 
块 网 络 接口 卡 [Guo 2009 ] ， 将 每 台 主机 连接 到 多 台 低 成 本 的 商用 交换 机 上 ， 并 且 人 允许 主 
机 自己 在 交换 机 间 智 能 地 为 流量 选 路 。 这 些 方案 的 变种 和 扩展 正 被 部 署 在 当前 的 数据 中 
心中 。 

男 一 种 重要 趋势 是 ， 大 型 云 提供 商 正 在 其 数据 中 心 越 来 越 多 地 建造 或 定制 几乎 所 有 东 
西 ， 包 括 网 络 适 配器 、 交 换 机 路 由 器 、TOR、 软 件 和 网 络 协议 [ Greenberg 2015; Singh 
2015 ] 。 由 亚马逊 开创 的 另 一 个 趋势 是 ， 用 “可 用 性 区 域 ” 来 改善 可 知性 ， 这 种 技术 在 不 
同 的 邻近 建筑 物 中 基本 上 复制 不 同 的 数据 中 心 。 通 过 让 建筑 物 邻近 〈 几 千 米 远 ) ， 互 相交 
互 的 数据 能 够 跨越 位 于 相同 可 用 性 区 域 的 数据 中 心 进行 同步 ， 与 此 同时 提供 容错 性 [Am- 
azon 2014 ] 。 数 据 中 心 设计 会 不 断 出 现 更 多 的 创新 ， 感 兴趣 的 读者 可 以 查看 近期 的 论文 和 
有 关 数 据 中 心 设计 的 视频 。 
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6.7 Elm: Web 页 面 请 求 的 历程 


既然 我 们 已 经 在 本 章 中 学 过 了 链 路 层 ， 并 且 在 前 面 几 章 中 学 过 了 网 络 层 、 运 输 层 和 应 
用 层 ， 那 么 我 们 沿 协议 栈 向 下 的 旅程 就 完成 了 ! 在 本 书 的 一 开始 (1.14), 我 们 说 过 
“本 书 的 大 部 分 内 容 与 计算 机 网 络 协议 有 关 ”， 在 本 章 中 ， 我们 无 疑 已 经 看 到 了 情况 的 确 如 
此 ! 在 继续 学 习 本 书 第 二 部 分 中 时 下 关注 的 章节 之 前 ， 通 过 对 已 双 mips oy 
的 、 全 面 的 展望 ， 我 们 希望 总 结 一 下 沿 协议 栈 向 下 的 旅程 。 而 做 这 个 “全 面 的 ”展望 的 一 
种 方法 是 识别 许多 (许多 !) 协议 ， eth ERWE EARANN: 下 载 一 个 Web 
页 面 。 图 6-32 图 示 了 我 们 的 场景 : 一 名 学 生 Bob 将 他 的 便携 机 与 学 校 的 以 太 网 交换 机 相 
JE, 下 载 一 个 Web 页面 (比如 说 www. google. com 主页 ) 。 如 我 们 所 知 ， 为 满足 这 个 看 起 
来 简单 的 请 求 ， 背 后 隐藏 了 许多 细节 。 本 章 后 面 的 Wireshark 实验 仔细 检查 了 包含 一 些 分 
组 的 踪迹 文件 ， 这 些 分 组 更 为 详细 地 涉及 类 似 的 场景 。 


» comcast.net 
. | 学 校 网 络 DNS 服务 器 
.00:16:D3:23:68:8A  68.80.2:0/24 






68.85.2.101 68.87.71.226 
| ey | | 
一 1 | 
Ge b 
00:22:6B:45:1F:1B_ -7 AO x 
Pi 68.85.21 ie __ foe 


www.google.com , | 
”Web 服务 器 一 
64.233.169.105 | | 


图 6-32 Web 页 请 求 的 历程 : 网 络 环境 和 动作 


6.7.1 准备 : DHCP, UDP, IP 和 以 太 网 


我 们 假定 Bob 启动 他 的 便携 机 ， 然 后 将 其 用 一 根 以 太 网 电缆 连接 到 学 校 的 以 太 网 交换 
机 ， 交 换 机 又 与 学 校 的 路 由 器 相连 ， 如 图 6-32 所 示 。 学 校 的 这 台 路 由 器 与 一 个 ISP 连接 ， 
本 例 中 ISP 为 comcast. net。 在 本 例 中 ，comcast. net 为 学 校 提供 了 DNS 服务 ; 所 以 ，DNS 
服务 器 驻 留 在 Comcast 网 络 中 而 不 是 学 校 网 络 中 。 我 们 将 假设 DHCP 服务 器 运行 在 路 由 融 
中 ， 就 像 常 见 情况 那样 。 

当 Bob 首先 将 其 便携 机 与 网 络 连接 时 ， 没 有 IP 地 址 他 就 不 能 做 任何 事情 (例如 下 载 
一 个 Web 网 页 ) 。 所 以 ，Bob 的 便携 机 所 采取 的 一 个 网 络 相 关 的 动作 是 运行 DHCP 协议 ， 
以 从 本 地 DHCP 服务 器 获得 一 个 IP 地 址 以 及 其 他 信息 。 

1) Bob 便携 机 上 的 操作 系统 生成 一 个 DHCP 请 求 报 文 (4. 3.3 节 ) ， 并 将 这 个 报 文 放 
人 具有 目的 端口 67 (DHCP 服务 器 ) 和 源 端 口 68 (DHCP 客户 ) 的 UDP 报 文 段 (3.3 4) 
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该 UDP 报 文 段 则 被 放置 在 一 个 具有 广播 卫 目 的 地 址 (255.255.255.255) 和 源 IP 地 址 
0.0.0.0 fy IP 数据 报 中 (4. 3.1 节 ) ， 因 为 Bob 的 便携 机 还 没有 一 个 IP 地 址 。 

2) 包含 DHCP 请 求 报 文 的 IP 数据 报 则 被 放置 在 以 太 网 由 中 (6.4.2 节 )。 该 以 太 网 
帧 具有 目的 MAC 地 址 FF: FF: FF:FF:FF:FF， 使 该 帧 将 广播 到 与 交换 机 连接 的 所 有 设备 
(如 果 顺 利 的 话 也 包括 DHCP 服务 器 ); 该 帧 的 源 MAC 地 址 是 Bob 便携 机 的 MAC 地 址 
00: 16: D3: 23: 68: 8A, 

3) 包含 DHCP 请 求 的 广播 以 太 网 帧 是 第 一 个 由 Bob 便携 机 发 送 到 以 太 网 交换 机 的 帧 。 
沪 交 换 机 在 所 有 的 出 端口 广播 入 帧 ， 包 括 连接 到 路 由 器 的 端口 。 

4) 路 由 需 在 它 的 具有 MAC 地 址 00: 22: 6B: 45: 1F 的 接口 接收 到 该 广播 以 太 网 帧 ， 该 
帧 中 包含 DHCP 请 求 ， 并 且 从 该 以 太 网 帧 中 抽取 出 数据 报 。 该 数据 报 的 广播 IP 目的 地 
址 指示 了 这 个 IP 数据 报应 当 由 在 该 节点 的 高 层 协议 处 理 ， 因 此 该 数据 报 的 载荷 〈 一 个 
UDP 报 文 段 ) 被 分 解 (3.2 节 ) 向 上 到 达 UDP, DHCP 请 求 报 文 从 此 UDP 报 文 段 中 抽取 
出 来 。 此 时 DHCP 服务 器 有 了 DHCP 请 求 报 文 。 

5) 我 们 假设 运行 在 路 由 器 中 的 DHCP 服务 器 能 够 以 CIDR (4.3.3 47) 块 68. 85. 2. 0/ 
24 分 配 IP 地 址 。 所 以 本 例 中 ， 在 学 校内 使 用 的 所 有 IP 地 址 都 在 Comcast 的 地 址 块 中 。 我 
们 假设 DHCP 服务 器 分 配 地 址 68. 85.2. 101 给 Bob 的 便携 机 。DHCP 服务 器 生成 包含 这 个 
IP 地 址 以 及 DNS 服务 颖 的 IP 地 址 (68. 87.71.226), BRUM Kee h AB AY IP 地址 
(68. 85.2.1) 和 子 网 块 (68. 85.2.0/24) 〈 等 价 为 “网 络 掩 码 ”) 的 一 个 DHCP ACK 报 文 
(4.3.3 节 )。 该 DHCP 报 文 被 放 入 一 个 UDP 报 文 段 中 ，UDP 报 文 段 被 放 人 一 个 IP 数据 报 
中 ， 卫 数据 报 再 被 放 人 一 个 以 太 网 帧 中 。 这 个 以 太 网 帧 的 源 MAC 地 址 是 路 由 需 连 到 归属 
网 络 时 接口 的 MAC 地 址 (00:22:6B:45:1F:1B)， 目 的 MAC 地 址 是 Bob 便携 机 的 MAC 地 
HE (00: 16: D3: 23:68: 8A) . 

6) 包含 DHCP ACK AY LAA R i h PR A tt AK SPRL. AAA CROLL SB SS S 
(6.4.3 节 )， 并 且 先 前 从 Bob 便携 机 收 到 (包含 DHCP 请 求 的 ) 以 太 网 帧 ， 所 以 该 交换 机 
知道 寻 址 到 00: 16: D3: 23: 68: 8A 的 帧 仅 从 通 向 Bob 便携 机 的 输出 端口 转发 。 

7) Bob 便携 机 接收 到 包含 DHCP ACK 的 以 太 网 帧 ， 从 该 以 太 网 帧 中 抽取 IP 数据 报 ， 
从 IP 数据 报 中 抽取 UDP 报 文 段 ， 从 UDP 报 文 段 抽 取 DHCP ACK 报 文 。Bob 的 DHCP 客户 
则 记录 下 它 的 IP 地 址 和 它 的 DNS 服务 器 的 卫 地 址 。 它 还 在 其 IP 转发 表 中 安装 默认 网 关 
的 地 址 (4. 1 节 ) 。Bob 便携 机 将 向 该 默认 网 关 发 送 目的 地 址 为 其 子 网 68. 85. 2.0/24 以 外 
的 所 有 数据 报 。 此 时 ，Bob 便携 机 已 经 初始 化 好 它 的 网 络 组 件 ， 并 准备 开始 处 理 Web 网 页 
获取 。( 注 意 到 在 第 4 章 给 出 的 四 个 步骤 中 仅 有 最 后 两 个 DHCP 步骤 是 实际 必要 的 。) 


6.7.2 仍 在 准备 : DNS 和 ARP 


当 Bob 将 www. google. com 的 URL 键入 其 Web 浏览 器 时 ， 他 开局 了 一 长 串 事 件 ， 这 将 
导致 谷歌 主页 最 终 显 示 在 其 Web 浏览 器 上 。Bob 的 Web 浏览 器 通过 生成 一 个 TCP ERF 
(2.7 节 ) 开始 了 该 过 程 ， 套 接 字 用 于 向 www. google. com £i% HTTP WHR (2.2 节 )。 为 了 
生成 该 套 接 字 ，Bob 便携 机 将 需要 知道 www. google. com 的 IP 地 址 。 我 们 在 2. 4 节 中 学 过 ， 
使 用 DNS 协议 提供 这 种 名 字 到 IP 地 址 的 转换 服务 。 

8) Bob 便携 机 上 的 操作 系统 因此 生成 一 个 DNS 查询 报 文 (2.4.3 节 )， 将 字符 串 
www. google. com 放 入 DNS 报 文 的 问题 段 中 。 该 DNS 报 文 则 放置 在 一 个 具有 53 号 (DNS 服务 
ar) 目的 端口 的 UDP 报 文 段 中 。 该 UDP 报 文 段 则 被 放 人 具有 IP 目的 地 址 68. 87. 71. 226 (在 
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第 5 46+) DHCP ACK 返回 的 DNS 服务 器 地 址 ) 和 源 IP 地 址 68. 85.2. 101 AY IP 数据 报 中 。 

9) Bob 便携 机 则 将 包含 DNS 请 求 报 文 的 数据 报 放 和 人 一 个 以 太 网 帧 中 。 该 帧 将 发 送 
(在 链 路 层 寻 址 ) 到 Bob 学 校 网 络 中 的 网 关 路 由 器 。 然 而 ， 即 使 Bob 便携 机 经 过 上 述 第 5 
步 中 的 DHCP ACK 报 文 知 道 了 学 校 网 关 路 由 器 的 IP 地址 (68. 85. 2. 1) ， 但 仍 不 知道 该 网 
关 路 由 器 的 MAC 地 址 。 为 了 获得 该 网 关 路 由 器 的 MAC 地 址 ，Bob 便携 机 将 需要 使 用 ARP 
协议 (6.4.1 节 )。 

10) Bob 便携 机 生成 一 个 具有 目的 IP 地址 68. 85. 2. 1 (默认 网 关 ) 的 ARP 查询 报 文 ， 
将 该 ARP 报 文 放置 在 一 个 具有 广播 目的 地 址 (FF: FF: FF: FF: FF:FF) 的 以 太 网 帧 中 ， 并 
向 交换 机 发 送 该 以 太 网 帧 ， 交 换 机 将 该 帧 交付 给 所 有 连接 的 设备 ， 包 括 网 关 路 由 器 。 

11) 网 关 路 由 器 在 通 往 学 校 网 络 的 接口 上 接收 到 包含 该 ARP 查询 报 文 的 帧 ， 发 现在 
ARP 报 文中 目标 IP 地 址 68. 85. 2. 1 匹配 其 接口 的 IP 地 址 。 网 关 路 由 器 因此 准备 一 个 ARP 
回答 ， 指 示 它 的 MAC 地址 00: 22: 6B: 45: 1F: 1B 对 应 IP 地 址 68. 85. 2. 1。 它 将 ARP 回答 放 
在 一 个 以 太 网 帧 中 ， 其 目的 地 址 为 00: 16: D3: 23: 68: 8A (Bob 便携 机 ) ， 并 向 交换 机 发 送 
该 帧 ， 再 由 交换 机 将 帧 交付 给 Bob 便携 机 。 

12) Bob 便携 机 接收 包含 ARP 回答 报 文 的 帧 ， 并 从 ARP 回答 报 文中 抽取 网 关 路 由 器 
的 MAC 地 址 (00: 22:6B: 45: 1F: 1B)。 | 

13) Bob 便携 机 现在 (最终 !) 能 够 使 包含 DNS 查询 的 以 太 网 帧 寻 址 到 网 关 路 由 器 的 
MAC 地 址 。 注 意 到 在 该 帧 中 的 IP 数据 报 具有 IP 目的 地 址 68. 87.71. 226 (DNS 服务 器 ) ， 
而 该 帧 具有 目的 地 址 00: 22: 6B: 45: 1F: 1B (网 关 路 由 器 ) Bob 便携 机 向 交换 机 发 送 该 帧 ， 
交换 机 将 该 帧 交付 给 网 关 路 由 器 。 


6.7.3 仍 在 准备 : 域内 路 由 选择 到 DNS 服务 器 


14) 网 关 路 由 器 接收 该 帧 并 抽取 包含 DNS 查询 的 IP 数据 报 。 路 由 器 查找 该 数据 报 的 
目的 地 址 (68. 87. 71. 226 ) ， 并 根据 其 转发 表决 定 该 数据 报应 当 发 送 到 图 6-32 的 Comcast 
网 络 中 最 左边 的 路 由 器 。IP 数据 报 放置 在 链 路 层 帧 中 ， 该 链 路 适合 将 学 校 路 由 需 连 接 到 最 
左边 Comcast 路 由 器 ， 并 且 该 帧 经 这 条 链 路 发 送 。 

15) 在 Comcast 网 络 中 最 左边 的 路 由 器 接收 到 该 帧 ， 抽 取 IP 数据 报 ， 检 查 该 数据 报 的 
目的 地 址 (68. 87. 71. 226) ， 并 根据 其 转发 表 确 定 出 接口 ， 经 过 该 接口 朝 着 DNS 服务 器 转 
发 数据 报 ， 而 转发 表 已 根据 Comcast 的 域内 协议 (An RIP, OSPF aX IS-IS, 5.3 7) 以 及 因 
特 网 的 域 间 协议 BGP (5.4 节 ) 所 填写 。 

16) RAGA DNS 查询 的 IP 数据 报到 达 了 DNS 服务 器 。DNS 服务 器 抽取 出 DNS 查 
询 报 文 ， 在 它 的 DNS 数据 库 中 查找 名 字 www. google. com (2.4 节 )， 找 到 包含 对 应 
www. google. com 的 IP 地址 (64. 233. 169. 105) 的 DNS 源 记 录 。 (假设 它 当 前 缓存 在 DNS 
服务 器 中 。) 前 面 讲 过 这 种 缓存 数据 源 于 google. com 的 权威 DNS 服务 器 (2.4.2 7), KH 
DNS 服务 器 形成 了 一 个 包含 这 种 主机 名 到 IP 地 址 映射 的 DNS 回答 报 文 ， 将 该 DNS 回答 报 
文 放 入 UDP 报 文 段 中 ,该 报 文 段 放 入 寻 址 到 Bob 便携 机 (68. 85.2. 101) 的 全 数据 报 中 。 
该 数据 报 将 通过 Comcast 网 络 反 向 转发 到 学 校 的 路 由 器 ， 并 从 这 里 经 过 以 太 网 交换 机 到 
Bob 便携 机 。 

17) Bob 便携 机 从 DNS 报 文 抽取 出 服务 器 www. google. com 的 IP Heit, RA, EAE 
工作 后 ，Bob 便携 机 此 时 准备 接触 www. google. com 服务 器 ! 
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6.7.4 Web 客户 -服务 器 交互 : TCP 和 HTTP 


18) 既然 Bob 便携 机 有 了 www. google. com 的 IP 地 址 ， 它 能 够 生成 TCP EF (2.7 
节 ) ， 该 套 接 字 将 用 于 向 www. google. com 发 送 HTTP GET 报 文 (2.2.3 节 )。 当 Bob 生成 
TCP 套 接 字 时 ， 在 Bob 便携 机 中 的 TCP 必须 首先 与 www. google. com 中 的 TCP 执行 三 次 握手 
(3.5.6 节 )。Bob 便携 机 因此 首先 生成 一 个 具有 目的 端口 80 (针对 HTTP 的 ) 的 TCP SYN 
报 文 段 ， 将 该 TCP 报 文 段 放置 在 具有 目的 IP 地 址 64. 233. 169. 105 (www. google. com) fy) IP 
数据 报 中 ， 将 该 数据 报 放置 在 MAC 地 址 为 00: 22: 6B: 45: 1F: 1B (网 关 路 由 器 ) 的 帧 中 ， 
并 回 交 换 机 发 送 该 帧 。 

19) 在 学 校 网 络 Comcast 网 络 和 谷歌 网 络 中 的 路 由 器 朝 着 www. google. com 转发 包含 
TCP SYN 的 数据 报 ， 使 用 每 台 路 由 器 中 的 转发 表 ， 如 前 面 步骤 14 ~ 16 那样 。 前 面 讲 过 文 
配 分 组 经 Comcast 和 谷歌 网 络 之 间 域 间 链 路 转发 的 路 由 器 转发 表 项 ， 是 由 BGP 协议 决定 
的 〈 第 5 章 )。 

20) RA, HA TCP SYN 的 数据 报到 达 www. googole. com。 从 数据 报 抽 取出 TCP SYN 
报 文 并 分 解 到 与 端口 80 相 联 系 的 欢迎 套 接 字 。 对 于 谷歌 HTTP 服务 器 和 Bob 便携 机 之 间 
的 TCP 连接 生成 一 个 连接 套 接 字 (2.7 节 )。 产 生 一 个 TCP SYNACK (3.5.6 节 ) 报 文 段 ， 
将 其 放 和 人 向 Bob 便携 机 寻 址 的 一 个 数据 报 中 ， 最 后 放 入 链 路 层 帧 中 ， 该 链 路 适合 将 
www. google. com 连接 到 其 第 一 跳 路 由 器 。 

21) 包含 TCP SYNACK 报 文 段 的 数据 报 通 过 谷歌 、Comcast 和 学 校 网 络 ， 最 终 到 达 
Bob 便携 机 的 以 太 网 卡 。 数 据 报 在 操作 系统 中 分 解 到 步骤 18 生成 的 TCP 套 接 字 ， 从 而 进 
人 连接 状态 。 

22) 借助 于 Bob 便携 机 上 的 套 接 字 ,现在 (终于 !) 准备 向 www. google. com 发 送 字 市 
T, Bob 的 浏览 器 生成 包含 要 获取 的 URL 的 HTTP GET 报 文 (2.2.3 节 )。HTTP GET 报 文 
则 写 人 套 接 字 ， 其 中 GET 报 文成 为 一 个 TCP RRM My. GH TCP 报 文 段 放 置 进 一 个 数 
据 报 中 ， 并 交付 到 www. google. com， 如 前 面 步骤 18 ~20 所 述 。 

23) 在 www. google. com 的 HTTP 服务 器 从 TCP 套 接 字 读 取 HTTP GET 报 文 ， 生 成 一 
A HTTP 响应 报 文 (2.2 节 ) ， 将 请 求 的 Web 页 内 容 放 和 人 HTTP 响应 体 中 ， 并 将 报 文 发 送 
进 TCP 套 接 字 中 。 

24) 包含 HTTP 回答 报 文 的 数据 报 通过 谷歌 、Comcast 和 学 校 网 络 转发 ， 到 达 Bob 便 
携 机 。Bob 的 Web 浏览 器 程序 从 套 接 字 读 取 HTTP 响应 ， 从 HTTP 响应 体 中 抽取 Web 网 页 
的 html, FRA (AT!) 显示 了 Web 网 页 。 

上 面 的 场景 已 经 涉及 许多 网 络 基 础 ! 如 果 你 已 经 理解 上 面 例子 中 的 大 多 数 或 全 
部 ， 则 你 也 已 经 涵盖 了 许多 基础 知识 ， 因 为 前 面 已 经 学 过 1. 1 节 ， 其 中 我 们 谈 道 “本 
书 的 大 部 分 内 容 与 计算 机 网 络 协 议 有 关 ”， 并 且 你 也 许 想 知道 一 个 协议 实际 是 什么 样 
F! 上 述 例 子 看 起 来 是 尽 可 能 详尽 ， 我 们 已 经 忽略 了 一 些 可 能 的 附加 协议 (例如 ， 运 
行 在 学 校 网 关 路 由 器 中 的 NAT， 到 学 校 网 络 的 无 线 接 人 ， 接 人 学 校 网 络 或 对 报 文 段 或 
数据 报 加 密 的 安全 协议 ， 网 络 管理 协议 ) ， 以 及 人 们 将 会 在 公共 因特网 中 遇 到 的 一 些 
考虑 (Web BFF, DNS 等 级 体系 ) 。 我 们 将 在 本 书 的 第 二 部 分 涉及 一 些 这 类 主题 和 更 
多 内 容 。 

最 后 ， 我 们 注意 到 上 述 例子 是 一 个 综合 、 完 整 的 例子 ， 还 观察 了 本 书 第 一 部 分 所 学 习 
过 的 许多 协议 的 十 分 “具体 的 细节 ”。 该 例子 更 多 地 关注 “怎样 做 ”而 不 是 “为 什么 做 ”。 
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BY FALSE FEN A A AINE AR A ALATE [Clark 
1988; RFC 5218] 。 


6.8 小 结 


在 这 一 章 中 ， 我 们 学 习 了 链 路 层 ， 包 括 它 的 服务 、 支 撑 它 操作 的 原则 和 许多 重要 的 特 
定 协议 ， 它 们 使 用 这 些 原则 实现 了 链 路 层 服务 。 

我 们 看 到 链 路 层 的 基本 服务 是 将 网 络 层 的 数据 报 从 一 个 节点 〈 主 机、 交换 机 、 路 由 
ar, WiFi 接 入 点 ) 移动 到 一 个 相 邻 的 节点 。 我 们 看 到 ， 在 通过 链 路 向 相 邻 节点 传输 之 前 ， 
所 有 链 路 层 协议 都 是 通过 将 网 络 层 数据 报 封 装 在 链 路 层 帧 中 来 操作 的 。 然 而 ， 除 了 这 个 共 
同 的 成 帧 功能 之 外 ， 我 们 知道 了 不 同 的 链 路 层 协议 提供 截然 不 同 的 链 路 接 人 、 交 付 和 传输 
服务 。 造 成 这 些 差异 的 部 分 原因 是 链 路 层 协议 必须 工作 在 很 多 种 链 路 类 型 上 。 一 个 简单 的 
点 对 点 链 路 具有 单个 发 送 方 和 接收 方 ， 并 通过 单一 “线路 ”通信 。 一 个 多 路 访问 链 路 在 许 
多 发 送 方 和 接收 方 之 间 共 享 ; 因此 ， 对 多 路 访问 信道 的 链 路 层 协议 有 一 个 协调 链 路 接 人 的 
协议 〈 它 的 多 路 访问 协议 ) 。 在 MPLS 的 情况 下 ， 连 接 两 个 相 邻 节点 (例如 ， 在 I 意义 上 
的 两 台 相 邻 的 IP 路由器， 它们 是 到 某 个 目的 地 的 下 一 跳 IP 路 由 器 ) 的 “ 链 路 ”， 其 本 身 
可 能 实际 上 就 是 一 个 网 络 。 从 某 种 意义 来 说 ， 将 一 个 网 络 视 为 一 条 “ 链 路 ”的 想法 没有 什 
么 可 奇怪 的 。 例 如 ， 连 接 家 庭 调 制 解 调 器 /计算 机 到 远 端 调制 解 调 右 /路 由 絮 的 一 条 电话 链 
路 ， 实 际 上 是 一 条 穿 过 精密 而 复杂 的 电话 网 络 的 路 径 。 

在 链 路 层 通信 所 依据 的 原理 中 ,我 们 研究 了 差错 检测 和 纠正 技术 、 多 路 访问 协议 、 
fe Pelz hk. ME (VLAN) 以 及 扩展 的 交换 局 域 网 和 数据 中 心 网 络 的 构造 方法 。 今 
天 对 链 路 层 的 许多 关注 在 于 这 些 交 换 网 络 。 在 差错 检测 /纠正 场景 中 ， 为 了 对 帧 通过 链 
路 传输 时 可 能 发 生 的 比特 翻转 进行 检测 并 在 某 些 情况 下 进行 纠正 ， 我 们 研究 了 在 帧 的 首 
部 增加 附加 比特 的 方法 。 我 们 讨论 了 简单 的 奇偶 校 验 和 检验 和 方案 ， 以 及 更 健壮 的 循环 
元 余 检测 。 然 后 我 们 转向 多 路 访问 协议 主题 。 我 们 确定 和 学 习 了 协调 访问 广播 信道 的 3 
大 类 方法 : 信道 划分 方法 (TDM, FDM) 、 随 机 接 入 方法 (ALOHA 协议 和 CSMA 协议 ) 
和 轮流 方法 ( 轮 询 和 令 牌 传递 )。 我 们 学 习 了 电缆 接 入 网 ， 发 现 它 使 用 了 多 种 这 些 多 路 
访问 方法 。 我 们 看 到 让 多 个 节点 共享 单个 广播 信道 的 结果 ， 是 需要 在 链 路 层 提供 节点 地 
址 。 我 们 知道 物理 地 址 和 网 络 层 地 址 是 非常 不 同 的 ， 而 且 在 因特网 场景 中 ， 一 个 专门 的 
协议 (ARP， 即 地 址 解析 协议 ) 用 于 在 这 两 种 寻 址 形式 之 间 进 行 转 换 ， 并 且 详 细 学 习 了 
极为 成 功 的 以 太 网 协议 。 然 后 我 们 研究 了 共享 一 个 广播 信道 的 节点 是 怎样 形成 一 个 局 域 
网 的 ， 以 及 多 个 局 域 网 怎样 能 够 互联 形成 一 个 更 大 的 局 域 网 ， 即 互联 这 些 本 地 节点 完全 
不 需要 网 络 层 路 由 选择 的 和 干预。 我 们 也 知道 了 多 个 虚拟 局 域 网 是 怎样 能 够 产生 一 个 单一 
的 物理 局 域 网 体系 结构 的 。 

通过 关注 当 MPLS 网 络 互联 了 王 路 由 器 时 是 如 何 提供 链 路 层 服务 的 和 展望 今天 用 于 大 型 
数据 中 心 的 网 络 设 计 ， 我们 结束 了 链 路 层 的 学 习 。 通 过 识别 在 获取 一 个 简单 的 Web 网 页 
时 所 需要 的 许多 协议 ， 我们 完成 了 本 章 ( 和 前 5 章 )。 在 学 习 了 链 路 层 后 ， 我 们 沿 协议 栈 
向 下 的 旅程 现在 结束 了 ! 当然， 物理 层 位 于 数据 链 路 层 之 下 ,但 是 物理 层 的 细节 也 许 最 好 
留 给 另外 一 门 课程 (例如 ， 在 通信 理论 而 不 是 计算 机 网 络 课程 中 ) 去 学 习 。 然 而 我 们 在 本 
章 和 第 1 ft (在 1.2 节 中 讨论 了 物理 媒体 ) 中 已 经 接触 了 物理 层 的 几 个 方面 。 当 我 们 在 下 
一 章 中 学 习 无 线 链 路 特性 时 ， 将 再 次 考虑 物理 层 。 
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尽管 我 们 沿 协议 栈 向 下 的 旅程 已 结束 ， 但 我 们 计算 机 网 络 的 学 习 仍 然 没 有 结束 。 在 后 
面 的 3 章 中 我 们 将 讨论 无 线 网 络 、 网 络 安 全 和 多 媒体 网 络 。 这 3 个 主题 不 便 放 进 任何 一 层 
中 ; 实际 上 每 个 主题 跨越 了 多 个 层次 。 因 此 理解 这 些 主题 (在 某 些 网 络 教材 中 被 列 为 高 级 
主题 ) 需要 对 协议 栈 所 有 层次 都 有 坚实 的 基础 ， 我 们 对 链 路 层 的 学 习 已 经 完成 了 这 样 的 
基础 ! 


课 后 习题 和 问题 





6.1~6.2 节 

RI. 考虑 在 6. 1. 1 节 中 的 运输 类 比 。 如 果 一 个 乘客 类 比 为 一 个 数据 报 ， 什 么 类 比 于 链 路 层 帧 ? 

R2. 如 果 在 因特网 中 的 所 有 链 路 都 提供 可 靠 的 交付 服务 TCP 可 靠 传输 服务 将 是 多 余 的 吗 ” 为 什么 ? 

R3. 链 路 层 协议 能 够 向 网 络 层 提供 哪些 可 能 的 服务 ”在 这 些 链 路 层 服务 中 ， 哪 些 在 IP 中 有 对 应 的 服务 ? 
哪些 在 TCP 中 有 对 应 的 服务 ? 

6. 3 节 

R4. 假设 两 个 节点 同时 经 一 个 速率 为 R 的 广播 信道 开始 传输 一 个 长 度 为 上 的 分 组 。 用 dee 表示 这 两 个 节 
点 之 间 的 传播 时 延 。 如 果 doy < LAR ， 会 出 现 碰撞 吗 ? 为 什么 ? 

RS. 在 6.3 We, 我们 列 出 了 广播 信道 的 4 种 希望 的 特性 。 这 些 特 性 中 的 哪些 是 时 际 ALOHA 所 具有 的 ? 
令 牌 传递 具有 这 些 特 性 中 的 哪些 ? 

R6. 在 CSMA/CD 中 ,在 第 5 次 碰撞 后 ， 节 点 选择 人 =4 的 概率 有 多 大 ? 结果 天 =4 在 10Mbps 以 太 网 上 对 
应 于 多 少 秒 的 时 延 ? 

R7. 使 用 人 类 在 鸡尾酒 会 交互 的 类 比 来 描述 轮 询 和 令 牌 传递 协议 。 

R8. 如 果 局 域 网 有 很 大 的 周 长 时 ， 为 什么 令 牌 环 协议 将 是 低 效 的 ? 

6.4 44 

R9. MAC 地 址 空间 有 多 大 ?IPv4 的 地 址 空间 呢 ? IPv6 的 地 址 空间 呢 ? 

R10. 假设 节点 A、B 和 C (通过 它们 的 适配器 ) 都 连接 到 同一 个 广播 局 域 网 上 。 如 果 A 向 B 发 送 数 千 个 
IP RHR. 每 个 封装 帧 都 有 BAY MAC 地 址 ，C 的 适配器 会 处 理 这 些 帧 吗 ? 如 果 会 ，C 的 适配器 将 
会 把 这 些 帧 中 的 IP 数据 报 传递 给 C 的 网 络 层 吗 ”如 果 A 用 MAC 广播 地 址 来 发 送 这 些 帧 ， 你 的 回答 
将 有 怎样 的 变化 呢 ? 

R11. ARP 查询 为 什么 要 在 广播 帧 中 发 送 呢 ? ARP 响应 为 什么 要 在 一 个 具有 特定 目的 MAC 地 址 的 帧 中 发 
送 呢 ? 

R12. 对 于 图 6-19 中 的 网 络 ， 路 由 器 有 两 个 ARP 模块 ， 每 个 都 有 自己 的 ARP 表 。 同 样 的 MAC 地 址 可 能 
在 两 张 表 中 都 出 现 吗 ? 

R13. 比较 10BASE-T、100BASE-T 和 吉 比 特 以 太 网 的 帧 结构 。 它 们 有 什么 不 同 吗 ? 

R14. 考虑 图 6-15。 在 4.3 节 的 寻 址 意义 下 ， 有 多 少 个 子 网 呢 ? 

RIS. 在 一 个 支持 802. 1Q 协议 交换 机 上 能 够 配置 的 VLAN 的 最 大 数量 是 多 少 ? 为 什么 ? 

R16. 假设 支持 天 个 VLAN 组 的 NN 台 交 换 机 经 过 一 个 干线 协议 连接 起 来 。 连 接 这 些 交 换 机 需要 多 少 端口 ? 
评价 你 的 答案 。 


习题 


Pl. 假设 某 分 组 的 信息 内 容 是 比特 模式 1110 0110 1001 1101, 并且 使 用 了 偶 校 验方 案 。 在 采用 二 维 奇 
偶 校 验方 案 的 情况 下 ， 包 含 该 检验 比特 的 字段 的 值 是 什么 ”你 的 回答 应 该 使 用 最 小 长 度 检验 和 
字段 。 


332 ROOF 


P4. 


R A 


P9. 


P10. 


Pi 


一 一 


P12. 


P13 


. 说 明 〈 举 一 个 不 同 于 图 6-5 的 例子 ) 二 维 奇偶 校 验 能 够 纠正 和 检测 单 比 特 差 错 。 说 明 ( 举 一 个 例子 ) 


某 些 双 比 特 差 错 能 够 被 检测 但 不 能 纠正 。 


. 假设 某 分 组 的 信息 部 分 〈 图 6-3 中 的 D) 包含 10 字 节 ， 它 由 字符 串 “Networking” 的 8 比特 无 符号 二 


进 制 ASCH 表示 组 成 。 对 该 数据 计算 因特网 检验 和 。 
考虑 前 一 个 习题 ， 但 此 时 假设 这 10 字 节 包含 : 
a. 数字 1 到 10 的 二 进 制 表 示 。 
b. 字母 B 到 K (KH) 的 ASCH 表示 。 
c. 字母 b 到 k (小 写 ) 的 ASCII 表示 。 
计算 这 些 数据 的 因特网 检验 和 。 


. 考虑 5 比特 生成 多 项 式 ，C = 10011， 并 且 假 设 D 的 值 为 1010101010。R 的 值 是 什么 ? 
. 考虑 上 一 个 习题 ， 这 时 假设 D 具有 值 : 


a. 1001010101 。 
b. 0101101010, 
c. 1010100000, 


. 在 这 道 习题 中 ， 我 们 探讨 CRC 的 某 些 性 质 。 对 于 在 6.2.3 节 中 给 出 的 生成 多 项 式 C( =1001) ， 回 答 


下 列 问题 : 
a 为 什么 它 能 够 检测 数据 D 中 的 任何 单 比特 差错 ? 
b. 上 述 C 能 够 检测 任何 奇数 比特 差错 吗 ? 为 什么 ? 


. 在 6.3 节 中 ,我们 提供 了 时 隙 ALOHA 效率 推导 的 概要 。 在 本 习题 中 ,我 们 将 完成 这 个 推导 。 


a. 前 面 讲 过 ， 当 用 个 活跃 节点 时 ， 时 隙 ALOHA 的 效率 是 Np(1 =p) 。 求 出 使 这 个 表达 式 最 大 
化 的 p 值 。 

b. 使 用 在 (a) PORN pf, 令 NN 接近 于 无 穷 ， 求 出 时 隙 ALOHA 的 效率 。( 提示 : YN 接近 于 无 
穷 时 , (1 - 1/N)" 接近 于 1/e。) 

说 明 纯 ALOHA 的 最 大 效率 是 1/(2e)。 注 意 : 如 果 你 完成 了 上 面 的 习题 ， 本 习题 就 很 简单 了 。 
考虑 两 个 节点 A ALB, Esl ai AAT BR ALOHA 协议 来 竞争 一 个 信道 。 假 定 节 点 A 比 节点 B 有 更 多 
的 数据 要 传输 ， 并 且 节 点 A 的 重 传 概率 p, 比 节点 B 的 重 传 概率 ps 要 大 。 

a 给 出 节点 A 的 平均 吞吐 量 的 公式 。 具 有 这 两 个 节点 的 协议 的 总 体 效 率 是 多 少 ? 

b. 如 果 p, =2p,, TA A 的 平均 吞吐 量 比 节点 B 的 要 大 两 倍 吗 ? 为 什么 ?如 果 不 是 ， 你 能 够 选择 什 
AFERI pa 和 ps 使 得 其 成 立 ? 

c. 一 般 而 言 ， 假 设 有 N 个 节点 ， 其 中 的 节点 A 具有 重 传 概率 2p 并 且 所 有 其 他 节点 具有 重 传 概率 p. 
给 出 表达 式 来 计算 节点 A 和 其 他 任何 节点 的 平均 吞吐 量 。 


. 假定 4 个 活跃 节点 A、B、C 和 D 都 使 用 时 际 ALOHA 来 竞争 访问 某 信道 。 假 设 每 个 节点 有 无 限 个 分 


组 要 发 送 。 每 个 节点 在 每 个 时 际 中 以 概率 p 尝试 传输 。 第 一 个 时 际 编 号 为 时 际 1， 第 二 个 时 际 编号 
FAT BR 2， 等 等 。 

a 节点 A 在 时 际 5 中 首先 成 功 的 概率 是 多 少 ? 

b. 某 个 节点 (A、B、C 或 D) 在 时 辽 4 中 成 功 的 概率 是 多 少 ? 

c. FEAT BR 3 中 出 现 首 个 成 功 的 概率 是 多 少 ? 

d. 这 个 4 节点 系统 的 效率 是 多 少 ? 

对 NN 的 下 列 值 ， 画 出 以 p A ema AT BR ALOHA 和 纯 ALOHA 的 效率 。 

a.N=15, 

DN=25. 

a. N=35: 

考虑 具有 NN 个 节点 和 传输 速率 为 R bps 的 一 个 广播 信道 。 假 设 该 广播 信道 使 用 轮 询 进 行 多 路 访问 
(有 一 个 附加 的 轮 询 节 点 )。 假 设 从 某 节点 完成 传输 到 后 续 节 点 允许 传输 之 间 的 时 间 量 ( 即 轮 询 时 
延 ) 是 du 。 假 设 在 一 个 轮 询 周期 中 ， 一 个 给 定 的 节点 允许 至 多 传输 0 比特 。 该 广播 信道 的 最 大 吞 


P14. 


PIS, 


P16. 


PLT. 


P18. 


P19, 
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吐 量 是 多 少 ? 

如 图 6-33 所 示 ， 考 虑 通过 两 台 路 由 顺 互 联 的 3 个 局 域 网 。 

a. 对 所 有 的 接口 分 配 IP 地 址 。 对 子 网 1 使 用 形式 为 192. 168. 1. xxx 的 地 址 ， 对 子 网 2 使 用 形式 为 
192. 168. 2. xxx 的 地 址 ， 对 子 网 3 使 用 形式 为 192. 168. 3. xxx 的 地 址 。 

b. 为 所 有 的 适配器 分 配 MAC 地 址 。 

c. 考虑 从 主机 下 向 主机 B 发 送 一 个 IP 数据 报 。 假 设 所 有 的 ARP 表 都 是 最 新 的 。 就 像 在 6.4.1 节 中 
对 单 路 由 器 例子 所 做 的 那样 ， 列 举 出 所 有 步骤 。 

d. 重复 (c) ， 现 在 假设 在 发 送 主机 中 的 ARP 表 为 空 〈 并 且 其 他 表 都 是 最 新 的 ) 。 

考虑 图 6-33。 现 在 我 们 用 一 台 交 换 机 代替 子 A 

网 1 和 子 网 2 之 间 的 路 由 器 ， 并 且 将 子 网 2 mm 

和 子 网 3 之 间 的 路 由 器 标记 为 R1。 =a 

a. 考虑 从 主机 下 向 主机 下 发 送 一 个 IP 数据 
报 。 主 机 王将 请 求 路 由 器 RI 帮助 转发 该 
数据 报 吗 ”为 什么 ? 在 包含 IP 数据 报 的 以 
AM bt, WANA AY IP A MAC 地 址 分 别 
是 什么 ? 

b. 假定 EE 希望 向 B 发 送 一 个 下 数据 报 ， 假 设 
E 的 ARP 缓存 中 不 包含 B 的 MAC Hitt. E 
将 执行 ARP 查询 来 发 现 B 的 MAC 地址 吗 ? 
为 什么 ? 在 交付 给 路 由 器 RI 的 以 太 网 帧 
(包含 发 向 B 的 IP 数 据 报 ) 中 ， 源 和 目的 
IP 和 MAC 地 址 分 别 是 什么 ? 图 6-33 由 路 由 器 互联 的 3 个 子 网 

c. 假定 主机 A 希望 向 主机 B 发 送 一 个 IP 数据 报 ，A 的 ARP 缓存 不 包含 B 的 MAC 地 址 ，B 的 ARP 
缓存 也 不 包含 A 的 MAC 地 址 。 进 一 步 假 定 交 换 机 Sl 的 转发 表 仅 包含 主机 B 和 路 由 器 RI 的 表 
项 。 因 此 ，A 将 广播 一 个 ARP 请 求 报 文 。 一 旦 交换 机 S 收 到 ARP 请 求 报 文 将 执行 什么 动作 ? 路 
由 器 RI 也 会 收 到 这 个 ARP 请 求 报 文 吗 ? 如 果 收 到 的 话 ，R1 将 向 子 网 3 转发 该 报 文 吗 ? 一 旦 主 
HLB 收 到 这 个 ARP 请 求 报 文 ， 它 将 向 主机 A 回 发 一 个 ARP 响应 报 文 。 但 是 它 将 发 送 一 个 ARP 查 
询 报 文 来 请 求 A 的 MAC 地 址 吗 ? 为 什么 ? 一 旦 交换 机 S1 收 到 来 自主 机 B 的 一 个 ARP 响应 报 文 ， 
它 将 做 什么 ? 

考虑 前 面 的 习题 ,但 是 现在 假设 用 一 台 交 换 机 代替 子 网 2 和 子 网 3 之 间 的 路 由 器 ， 在 这 种 新 的 场景 

中 回答 前 面 习题 中 的 问题 (a) ~ (e)a 

前 面 讲 过 ， 使 用 CSMA/CD Hil, 适配器 在 碰撞 之 后 等 待 K: 512 比特 时 间 ， 其 中 天 是 随机 选取 的 。 

对 于 K = 100， 对 于 一 个 10Mbps 的 广播 信道 ， 适 配器 返回 到 第 二 步 要 等 多 长 时 间 ? 对 于 100Mbps 的 

广播 信道 来 说 呢 ? 

假设 节点 A 和 节点 B 在 同一 个 10Mbps 广播 信道 上 ， 这 两 个 节点 的 传播 时 延 为 325 比特 时 间 。 假 设 

对 这 个 广播 信道 使 用 CSMA/CD 和 以 太 网 分 组 。 假 设 节点 A 开始 传输 一 帧 ， 并 且 在 它 传输 结束 之 前 

节点 B 开始 传输 一 帧 。 在 A 检测 到 B 已 经 传输 之 前 ，A 能 完成 传输 吗 ” 为 什么 ”如果 回答 是 可 以 ， 

则 A 错误 地 认为 它 的 帧 已 成 功 传输 而 无 碰撞 。 提 示 : 假设 在 上 =0 比特 时 刻 ，A 开始 传输 一 帧 。 在 最 

坏 的 情况 下 ，A 传输 一 个 512 + 64 比特 时 间 的 最 小 长 度 的 帧 。 因 此 A 将 在 上 =512 +64 比特 时 刻 完成 

帆 的 传输 。 如 果 B 的 信号 在 比特 时 间 :=512 +64 比特 之 前 到 达 A， 则 答案 是 否定 的 。 在 最 坏 的 情况 

下 ，B 的 信号 什么 时 候 到 达 A? 

假设 节点 A 和 节点 B 在 相同 的 10Mbps 广播 信道 上 ， 并 且 这 两 个 节点 的 传播 时 延 为 245 比特 时 间 。 

假设 A A B 同时 发 送 以 太 网 帧 ， 帧 发 生 了 碰撞 ， 然 后 A A B E CSMA/CD 算法 中 选择 不 同 的 K 值 。 

假设 没有 其 他 节点 处 于 活跃 状态 , 来 自 A 和 B 的 重 传 会 碰撞 吗 ? 为 此 ， 完 成 下 面 的 例子 就 足以 说 明 

问题 了 。 假设 A 和 B 在 :=0 比特 时 间 开 始 传输 。 它 们 在 上 =245 比特 时 间 都 检测 到 了 碰撞 。 假 设 
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K, =0 ,As = 1 。B 会 将 它 的 重 传 调整 到 什么 时 间 ? A 在 什么 时 间 开 始 发 送 ? (注意 : 这 些 节点 在 返 
回 第 2 步 之 后 ， 必须 等 待 一 个 空闲 信道 ， EMI.) A 的 信号 在 什么 时 间 到 达 B 呢 ? B 在 它 预定 
的 时 刻 抑制 传输 吗 ? 

在 这 个 习题 中 ， 你 将 对 一 个 类 似 于 CSMA/CD 的 多 路 访问 协议 的 效率 进行 推导 。 在 这 个 协议 中 ， 时 

A> ANT BR, IFA PATE AC HEAR SAT RIA] AE. SAT, PAY BR ALOHA 不 同 的 是 ,一 个 时 际 的 长 度 

(以 秒 计 ) 比 一 帧 的 时 间 〈 即 传输 一 帧 的 时 间 ) 小 得 多 。 令 S 表示 一 个 时 际 的 长 度 。 假 设 所 有 帧 都 

有 恒定 长 度 L=kRS， 其 中 R 是 信道 的 传输 速率 ,有 是 一 个 大 整数 。 假 定 用 个 节点 ， 每 个 节点 都 有 

无 穷 多 帧 要 发 送 。 我 们 还 假设 dup < S$ ， 以 便 所 有 节点 在 一 个 时 际 时 间 结 束 之 前 能 够 检测 到 碰撞 ， 

这 个 协议 描述 如 下 : 

o 对 于 某 给 定 的 时 阶 ， 如 果 没 有 节点 占有 这 个 信道 ， 所 有 节点 竞争 该 信道 ， 特别 是 每 个 节点 以 概 
率 p 在 该 时 阶 传输 。 如 果 刚 好 有 一 个 节点 在 该 时 际 中 传输 ,该 节点 在 后 续 的 上 -1 个 时 际 占有 信 
道 ， 并 传输 它 的 整个 帧 。 

e 如 果 某 节点 占用 了 信道 ， 所 有 其 他 节点 抑制 传输 ， 直 到 占有 信道 的 这 个 节点 完成 了 该 帧 的 传输 
为 止 。 一 旦 该 节点 传输 完 它 的 帧 ， 所 有 节点 竞争 该 信道 

注意 到 此 信道 在 两 种 状态 之 间 交 替 :“ 生 产 性 状态 ”( 它 恰好 持续 上 个 时 队 ) 和 “ 非 生 产 性 
状态 ”( 它 持续 随机 数 个 时 隙 ) 。 显 然 ， 该 信道 的 效率 是 k/k +a), HEP x 是 连续 的 非 生产 性 时 
际 的 期 望 值 。 

a. 对 于 固定 的 NN 和 pp， 确定 这 个 协议 的 效率 。 

b. 对 于 固定 的 YN， 确定 使 该 效率 最 大 化 的 p 值 。 

c 使 用 在 (b) 中 求 出 的 p (EE N WRO, MEM N 趋向 无 穷 时 的 效率 。 
ee ee 


. 现在 考虑 习题 P14 中 的 图 6-33。 对 主机 A、 两 台 路 由 费 和 主机 下 的 各 个 接口 提供 MAC 地 址 和 IP Hh 


址 。 假 定 主机 A 向 主机 下 发送 一 个 数据 报 。 de 传输 该 帧 时 ， 给 出 在 封装 该 P 数据 报 的 
帧 中 的 源 和 目的 MAC 地 址 : (i) 从 A 到 左边 的 路 由 器 ; (ii) 从 左边 的 路 由 器 到 右边 的 路 由 器 ; 
(iii) 从 右边 的 路 由 器 到 F。 还 要 给 出 到 达 每 个 点 时 封装 在 该 帧 中 的 PP 数据 报 中 的 源 和 目的 IP 
地 址 。 

现在 假定 在 图 6-33 最 左边 的 路 由 还 被 一 台 交 换 机 替换 。 os he ht sn 
方式 与 这 台 交 换 机 相连 。 当 在 下 列 场合 传输 该 帧 时 ， 给 出 在 封装 该 卫 数据 报 的 帧 中 的 源 和 目的 
WE 
F。 还 要 给 出 到 达 每 个 点 时 封装 在 该 帧 中 的 IP 数据 报 中 源 和 目的 IP 地址 。 

考虑 图 6-15。 假 定 所 有 链 路 都 是 100Mbps。 在 该 网 络 中 的 9 台 主 机 和 两 台 服 务 器 之 间 ， 能 够 取得 的 
最 大 总 聚合 吞吐 量 是 多 少 ? 你 能 够 假设 任何 主机 或 服务 器 能 够 向 任何 其 他 主机 或 服务 器 发 送 分 组 。 
为 什么 ? 

假定 在 图 6-15 中 的 3 台 连 接 各 系 的 交换 机 用 集线器 来 代替 。 所 有 链 路 是 100Mbps。 现 在 回答 习题 
P23 中 提出 的 问题 。 

假定 在 图 6-15 中 的 所 有 交换 机 用 集线器 来 代替 。 所 有 链 路 是 100Mbps。 现 在 回答 在 习题 P23 中 提出 
的 问题 。 

在 某 网 络 中 标识 为 A 到 FF 的 6 个 节点 以 星 形 与 一 台 交 换 机 连接 ， 考 虑 在 该 网 络 环境 中 某 个 正在 
学 习 的 交换 机 的 运行 情况 。 假 定 : (G) B 向 下 发 送 一 个 帧 ; (ii) 下 向 B 回 答 一 个 帧 ; (ii) A 
向 B 发 送 一 个 帧 ; (iv) B 向 A 回 答 一 个 帧 。 该 交换 机 表 初 始 为 空 。 显 示 在 这 些 事件 的 前 后 该 
交换 机 表 的 状态 。 对 于 每 个 事件 ， 指 出 在 其 上 面 转发 传输 的 帧 的 链 路 ， 并 简要 地 评价 你 的 
答案 。 

在 这 个 习题 中 ， 我 们 探讨 用 于 P 语音 应 用 的 小 分 组 。 小 分 组 长 度 的 一 个 主要 缺点 是 链 路 带宽 的 较 
大 比例 被 首部 字 节 所 消耗 。 基 于 此 ， 假 定 分 组 是 由 PP 字 节 和 5 字 节 首 部 组 成 。 

a. 考虑 直接 发 送 一 个 数字 编码 语音 源 。 假 定 该 源 以 128kbps 的 恒定 速率 进行 编码 。 假 设 每 个 源 向 网 
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络 发 送 分 组 之 前 每 个 分 组 被 完全 填充 。 填 充 一 个 分 组 所 需 的 时 间 是 分 组 化 时 延 ( packetization 
delay) 。 根 据 L， 确 定 分 组 化 时 延 ( 以 毫秒 计 ) 。 

b. 大 于 20 毫秒 的 分 组 化 时 延 会 导致 一 个 明显 的 、 令 人 不 快 的 回音 。 对 于 工 = 1500 字 节 (大致 对 
应 于 一 个 最 大 长 度 的 以 太 网 分 组 ) 和 上 =50 字 节 (对 应 于 一 个 ATM 信 元 ) ， 确 定 该 分 组 化 
时 延 。 

c. 对 R=622Mbps 的 链 路 速率 以 及 L=1500 FHA L=50 字 节 ,计算 单 台 交换 机 的 存储 转发 时 延 。 

d. 对 使 用 小 分 组 长 度 的 优点 进行 评述 。 

考虑 图 6-25 中 的 单个 交换 VLAN， 假 定 一 台 外 部 路 由 器 与 交换 机 端口 1 AE. A EE 和 CS 的 主机 和 

路 由 器 接口 分 配 卫 地 址 。 跟 踪 从 EE 主机 向 CS 主机 传送 一 个 数据 报时 网 络 层 和 链 路 层 所 采取 的 步 

Re (提示; 重读 课文 中 对 图 6-19 的 讨论 ) 。 

考虑 显示 在 图 6-29 中 的 MPLS 网 络 ， 假 定 路 由 器 RS 和 R6 现在 是 MPLS 使 能 的 。 假 定 我 们 要 执行 流 

ETHE, EM RO 发 往 A 的 分 组 要 经 R6- R4- R3- R1 交换 到 A， 从 RS 发 向 A 的 分 组 要 过 R5- R4- R2- 

RI 交换。 给 出 R5 和 R6 中 的 MPLS 表 以 及 在 R4 中 修改 的 表 ， 使 得 这 些 成 为 可 能 。 

再 次 考虑 上 一 个 习题 中 相同 的 场景 ,但 假定 从 R6 发 往 D 的 分 组 经 R6-R4-R3 交换 ， 而 从 RS AE D 

的 分 组 经 R4- R2- R1- R3 交换 。 说 明 为 使 这 些 成 为 可 能 在 所 有 路 由 器 中 的 MPLS 表 。 


. 在 这 个 习题 中 ， 你 将 把 已 经 学 习 过 的 因特网 协议 的 许多 东西 拼装 在 一 起 。 假 设 你 走 进 房间 ， 与 以 太 


网 连接 ， 并 下 载 一 个 Web 页 面 。 从 打开 PC 电源 到 得 到 Web 网 页 ， 发 生 的 所 有 协议 步骤 是 什么 ? 假 

设 当 你 给 PC 加 电 时 ， 在 DNS 或 浏览 器 缓存 中 什么 也 没有 。 (提示 : 步骤 包括 使 用 以 太 网 、DHCP、 

ARP, DNS, TCP 和 HTTP 协议 。) 明确 指出 在 这 些 步 又 中 你 如 何 获 得 网 关 路 由 器 的 了 A MAC 地 址 。 

考虑 在 图 6-30 中 具有 等 级 拓扑 的 数据 中 心 网 络 。 假 设 现在 有 80 对 流 ， 在 第 1 和 第 9 机 架 之 间 有 10 

个 流 ， 在 第 2 和 第 10 机 架 之 间 有 10 个 流 ， 等 等 。 进 一 步 假设 网 络 中 的 所 有 链 路 是 10Gbps， 而 主机 

和 TOR 交换 机 之 间 的 链 路 是 1Cbps。 

a 每 条 流 具 有 相同 的 数据 率 ; 确定 一 条 流 的 最 大 速率 。 

b. 对 于 相同 的 流量 模式 ， 对 于 图 6-31 中 高 度 互 联 的 拓扑 ， 确 定 一 条 流 的 最 大 速率 。 

c. 现在 假设 有 类 似 的 流量 模式 ， 但 在 每 个 机 架 上 涉及 20 台 主 机 和 160 对 流 。 确 定 对 这 两 个 拓扑 的 
最 大 流速 率 。 

考虑 图 6-30 中 所 示 的 等 级 网 络 ， 并 假设 该 数据 中 心 需要 在 其 他 应 用 程序 之 间 支 持 电 子 邮 件 和 视频 分 

发 。 假 定 4 个 服务 器 机 架 预 留用 于 电子 邮件 ，4 个 服务 器 机 架 预 留用 于 视频 。 对 于 每 个 应 用 ， 所 有 

4 个 机 架 必 须 位 于 某 单一 的 二 层 交 换 机 之 下 ， 因 为 二 层 到 一 层 链 路 没有 充足 的 带宽 来 支持 应 用 内 部 

的 流量 。 对 于 电子 邮件 应 用 ， 假 定 99.9% 时 间 仅 使 用 3 个 机 架 ， 并 且 视 频 应 用 具有 相同 的 使 用 

模式 。 

a. 电子 邮件 应 用 需要 使 用 第 4 个 机 架 的 时 间 比 例 有 多 大 ? 视频 应 用 需要 使 用 第 4 个 机 架 的 时 间 比 例 
有 和 多大? 

b. 假设 电子 邮件 使 用 和 视频 使 用 是 独立 的 ， 这 两 个 应 用 需要 其 第 4 个 机 架 的 时 间 比 例 有 多 大 (等 价 
地 ， 概 率 有 多 大 )? 

ce 假设 对 于 一 个 应 用 服务 器 短缺 的 时 间 具 为 0.001% 或 更 少 (引起 用 户 在 极 短 时 间 内 性 能 恶化 )。 
讨论 在 图 6-31 中 的 拓扑 能 够 怎样 使 用 ， 使 得 仅 7 个 机 架 被 共同 地 分 配给 两 个 应 用 (假设 拓扑 能 
够 支持 所 有 流量 ) 。 


j | Wireshark 实验 


在 与 本 教科 书 配套 的 Web 站 点 (http://www. pearsonhighered. com/cs- resources/) 上 ， 你 将 找到 一 个 


Wireshark 实验 ， 该 实验 研究 了 IEEE 802.3 协议 的 操作 和 以 太 网 帧 格式 。 第 二 个 Wireshark 实验 研究 了 在 
家 庭 网 络 场景 下 所 获取 的 分 组 踪迹 。 
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e 为 什么 您 决定 专注 于 网 络 ? 

HRF 1969 年 秋季 作为 一 名 研究 生 新 生来 到 UCLA 时 ， 我 原来 的 意图 是 研究 控制 论 。 后 来 我 参加 了 
Leonard Kleinrock 的 排队 论 课程 ， 他 给 我 留 下 了 深刻 印象 。 不 久 后 ,我 以 排队 系统 的 自 适应 控制 作为 可 能 
的 论文 题目 进行 了 研究 。 在 1972 年 初 ，Larry Roberts 启动 了 ARPAnet 卫星 系统 项 目 (后 来 称 为 分 组 卫 
Æ). Kleinrock 教授 请 我 参加 该 项 目 。 我 们 做 的 第 一 件 事 是 为 时 际 ALOHA 协议 引入 一 个 简单 而 实用 的 回 
退 算法 。 不 久 后 ,我 发 现 了 许多 有 趣 的 研究 问题 ， 如 ALOHA 的 不 稳定 性 问题 和 对 自 适 应 回 退 的 需求 ， 
这 些 形成 了 我 学 位 论文 的 核心 。 

o 20 世纪 70 年 代 您 开始 了 在 UCLA 的 学 生生 涯 ,活跃 于 因特网 的 早期 阶段 。 那 时 的 情况 怎样 那 

时 人 们 对 因特网 将 变 成 什么 样 有 哪些 大 致 想法 ? 

那 时 的 环境 与 我 曾 在 产业 界 和 学 术 界 所 见 到 的 其 他 系统 构建 项 目的 确 没 什么 不 同 。ARPAnet 初始 规 
定 的 目标 是 相当 谨慎 的 ， 即 提供 从 远程 位 置 接 入 昂贵 的 计算 机 的 手段 ， 使 许多 科学 家 能 够 使 用 这 些 计算 
机 。 然 而 ， 随 着 分 组 卫星 项 目 于 1972 年 和 分 组 无 线 电 项 目 于 1973 年 启动 ，ARPA 的 目标 有 了 相当 大 的 扩 
展 。 到 了 1973 年 ，ARPA 同时 建造 了 3 个 不 同 的 分 组 网 络 ， 对 Vint Cerf 和 Bob Kahn 来 说 研发 互联 策略 变 
得 有 必要 了 。 

回顾 过 去 ， 所 有 这 些 网 络 方面 的 进步 和 进展 被 视 为 (我 相信 ) 符合 逻辑 的 而 不 是 虚幻 的 。 没 有 人 能 
够 想象 到 今天 的 因特网 规模 和 个 人 计算 机 的 能 力 。 在 第 一 台 PC 出 现 之 前 有 十 多 年 时 间 。 那 时 为 了 正确 
地 做 处 理 ， 多 数学 生 以 一 系列 穿孔 卡片 的 形式 提交 他 们 的 计算 机 程序 以 进行 批 处 理 。 仅 有 某 些 学 生 能 够 
直接 接触 计算 机 ， 而 计算 机 通常 位 于 一 个 受 限 的 区 域 中 。 调 制 解 调 器 速度 缓慢 且 稀 有 。 作 为 一 名 人 研究生， 
在 书桌 上 我 仅 有 一 部 电话 机 ， 使 用 铅笔 和 纸 从 事 我 的 大 部 分 工作 。 

© 您 认为 网 络 和 因特网 未 来 将 往 何 处 发 展 ? 

在 过 去 ， 因 特 网 卫 协 议 的 简单 性 是 它 在 竞争 上 取胜 的 最 大 法 宝 ， 并 且 成 为 网 络 互 联 事实 上 的 标 
准 。 与 它 的 竞争 对 手 如 20 世纪 80 年 代 的 X. 25 和 20 世纪 90 年 代 的 ATM 不 同 ，IP 能 够 在 任何 链 路 层 
联网 技术 之 上 运行 ， 因 为 它 仅 提 供 尽 力 而 为 的 数据 报 服务 。 因 此 ， 任 何 分 组 网 络 都 能 够 连接 到 因 特 
网 上 。 

SR, IP 的 最 大 长 处 实际 上 成 了 一 种 缺点 。IP 目前 像 一 件 紧 身 衣 ， 限 制 了 因特网 向 特定 方 回 发 展 。 
近年 来 ， 许 多 研究 人 员 仅 将 他 们 的 努力 重新 定向 到 应 用 层 上 。 在 无 线 自 组 织 网 络 、 传 感 网络 和 卫星 网 络 
方面 也 做 了 大 量 研究 工作 。 这 些 网 络 能 够 看 作 独 立 的 系统 或 链 路 层 系 统 ， 因 为 位 于 IP 的 紧身 衣 之 外 ， 所 
以 它们 能 够 繁荣 发 展 。 

许多 人 对 于 P2P 系统 可 能 作为 新 奇 的 因特网 应 用 的 平台 而 感到 欢欣 鼓舞 。 然 而 ，P2P 系统 在 使 用 因 
特 网 资源 方面 效率 很 低 。 我 关注 的 一 个 问题 是 ， 随 着 因特网 不 断 互 联 各 种 设备 和 支持 未 来 的 P2P 使 能 的 
应 用 ， 因 特 网 核心 的 传输 和 交换 能 力 比 起 对 因特网 流量 的 需求 来 说 ， 前 者 是 否 将 更 快 地 不 断 增 加 。 没 有 
大 量 的 容量 预 留 ， 在 面临 恶意 攻击 和 拥塞 时 ， 确 保 网 络 稳定 性 将 是 一 项 重要 的 任务 。 

因特网 的 急剧 增长 也 要 求 以 高 速率 为 全 世界 的 网 络 操作 者 和 企业 分 配 新 的 P 地 址 。 以 当前 速度 ， 
未 分 配 的 IP 地 址 池 将 在 几 年 内 消耗 至 尽 。 当 该 事件 发 生 时 ， 仅 能 从 IPv6 地 址 空间 中 分 配 大 量 地 址 空间 
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的 相 邻 块 了 。 因 为 IPv6 采用 的 启动 缓慢 ， 由 于 对 早期 用 户 缺 乏 激 励 ， 所 以 IPv4 和 IPv6 将 很 有 可 能 在 
今后 的 因特网 上 共存 很 多 年 。 从 IPv4 主宰 的 因特网 向 IPvw6 主宰 的 因特网 迁移 将 需要 全 球 做 出 巨大 的 
努力 。 

。 您 的 工作 最 具 挑 战 性 的 部 分 是 什么 ? 

我 的 工作 最 具 挑 战 性 的 部 分 是 ， 作 为 一 名 教授 传授 和 激发 我 课堂 上 的 每 个 学 生 以 及 我 所 指导 的 每 个 
博士 研究 生 ， 而 不 只 是 获得 重要 的 成 就 。 非 常 聪明 和 有 学 习 动 力 的 人 可 能 要 求 少量 的 引导 而 非 许多 其 他 
东西 。 我 经 常 从 学 生 那 里 学 到 很 多 东西 ， 比 他 们 从 我 这 里 学 到 的 多 。 教 育 和 激励 学 术 上 落后 的 学 生 是 一 
项 重要 的 挑战 。 

© 您 能 预见 到 技术 对 未 来 学 习 方 面 有 哪些 影响 ? 

最 终 几 乎 所 有 的 人 类 知识 将 可 以 通过 因特网 得 到 ， 因 特 网 将 成 为 最 为 强 有 力 的 学 习 工 具 。 这 种 巨大 
的 知识 库 将 具有 为 全 世界 的 学 生 们 提供 公平 竞争 环境 的 潜力 。 例 如 ， 任 何 国 家 的 有 上 进 心 的 学 生 将 能 够 
访问 最 好 课程 的 Web 站点、 多 媒体 演讲 和 教学 材料 。 据 说 IEEE 和 ACM 数字 图 书馆 已 经 加 速 了 中 国 的 计 
算 机 科学 研究 的 发 展 。 与 此 同时 ， 因 特 网 将 超越 所 有 学 习 的 地 理 障碍 。 
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在 电话 技术 领域 ， 过 去 的 20 年 无 疑 可 认为 是 蜂窝 电话 技术 的 黄金 发 展期 。 全 球 范围 
的 移动 蜂窝 电话 用 户 数量 从 1993 年 的 3400 万 增长 到 2014 年 的 超过 70 亿 ， 同 时 蜂窝 电话 
用 户 数量 现在 也 超过 了 有 线 电话 用 户 数量 。 现 在 移动 电话 的 订购 数量 比 我 们 地 球 上 的 人 口 
数量 还 要 多 。 蜂 窝 电话 的 许多 优点 是 显而易见 的 ， 通 过 一 个 移动 性 强 、 重 量 轻 的 设备 ， 能 
在 任何 地 方 、 任 何 时 间 无 颖 地 接 人 全 球 电话 网 络 。 最 近 ， 便 携 机 、 智 能 手机 和 平板 电脑 能 
够 以 无 线 方式 经 过 蜂窝 网 或 Wiki 网 络 连接 到 因特网 ， 而 且 ， 如 游戏 机 、 恒 温 调节 升 、 家 
庭 安 全 系统 、 家 用 器 具 、 手 表 、 上 眼镜、 汽车、 流量 控制 系统 等 设备 也 越 来 越 多 地 以 无 线 方 
式 连 接 到 因特网 。 

从 网 络 的 观点 来 说 ， 由 这 些 无 线 和 移动 设备 联网 所 引发 的 挑战 ， 特 别 是 在 数据 链 路 层 
和 网 络 层 ， 与 传统 的 有 线 网 络 的 差别 非常 大 ， 适 合用 单独 一 章 〈 即 本 章 ) 的 篇 幅 来 专门 讨 
论 无 线 网 络 和 移动 网 络 。 

在 本 章 中 ， 我 们 首先 讨论 移动 用 户 、 无 线 链 路 和 网 络 ， 以 及 它们 与 所 连接 的 更 大 网 络 
(通常 是 有 线 网 络 ) 之 间 的 关系 。 我 们 将 指出 以 下 两 方面 的 差别 : 一 个 是 在 该 网 络 中 由 通 
信和 链 路 的 无 线 特性 所 带 来 的 挑战 ， 男 一 个 是 由 这 些 无 线 链 路 使 能 的 移动 性 。 在 无 线 和 移动 
性 之 间 做 重要 区 分 ， 使 我 们 能 更 好 地 区 分 、 标 识 和 掌握 在 每 个 领域 中 的 重要 概念 。 值 得 注 
意 的 是 ， 确 实在 许多 网 络 环境 中 网 络 节点 是 无 线 的 而 不 是 移动 的 〈 例 如 具有 固定 工作 站 和 
大 显示 器 的 无 线 家 庭 或 办 公 网 络 ) ， 而 有 限 的 移动 性 也 并 不 要 求 用 无 线 链 路 〈 例 如 ， 一 个 
在 家 里 使 用 便携 机 的 员工 ， 关 闭 便 携 机 ， 开 车 去 工作 ， 然 后 将 该 便携 机 连接 到 公司 的 有 线 
网 络 上 ) 。 当 然 ， 许 多 最 让 人 激动 的 网 络 环境 是 那些 让 用 户 同 时 具有 无 线 和 移动 性 的 网 络 
环境 。 例 如 在 下 列 情 况 下 ， 一 个 移动 用 户 (不 妨 假设 其 正 坐 在 汽车 后 座 上 ) 维持 一 个 IP 
语音 呼叫 和 多 个 进行 中 的 TCP 连接 ， 同 时 又 以 每 小 时 160 公里 的 速度 飞驰 在 高 速 公 路 上 。 
正 是 在 这 种 具有 无 线 和 移动 的 交集 的 场合 中 ， 我 们 将 会 发 现 最 有 趣 的 技术 挑战 。 

首先 我 们 将 说 明 用 于 考虑 无 线 通信 和 移动 性 的 环境 ， 即 无 线 (并 可 能 是 移动 ) 用 户 通 
过 位 于 网 络 边缘 的 无 线 链 路 连接 进 更 大 的 网 络 基 础 设施 的 网 络 。 然 后 在 7.2 节 中 ， 我 们 考 
虑 这 种 无 线 链 路 的 特性 ， 还 将 包括 一 个 对 码 分 多 址 接 和 人 (Code Division Multiple Access, 
CDMA) 的 简要 介绍 。CDMA 是 一 个 在 无 线 网 络 中 经 常 使 用 的 共享 媒体 接 人 协议 。 在 7.3 
节 中 ， 我 们 将 更 为 深入 地 分 析 IEEE 802.11 (WiFi) 无 线 LAN 标准 的 链 路 级 方面 ; 同时 我 
们 还 将 对 蓝牙 和 其 他 无 线 个 人 域 网 络 做 简要 描述 。 在 7.4 节 中 ,我 们 概述 蜂窝 因特网 接 
入 ， 其 中 包括 3G 和 正在 兴起 的 4G 蜂窝 技术 ， 这 些 技术 能 够 同时 提供 语音 和 高 速 因特网 
接 入 。 在 7.5 市 ， 我们 将 注意 力 转向 移动 性 ， 关 注 于 移动 用 户 的 定位 问题 、 对 移动 用 户 的 
路 由 选择 以 及 “切换 ”(handing off) 移动 用 户 〈 即 在 网 络 中 从 一 个 接 人 点 动态 地 移动 到 
男 一 点 的 用 户 ) 等 问题 。 在 7.6 节 和 7.7 节 中 ， 我 们 将 分 别 考察 如 何在 企业 802. 11 网 络 
和 LTE 蜂窝 网 络 中 用 移动 IP 标准 实现 这 些 移动 服务 。 最 后 ， 我 们 将 在 7.8 节 中 考虑 无 线 
链 路 和 移动 性 对 运输 层 协 议和 网 络 应 用 程序 的 影响 。 
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7.1 概述 


图 7-1 显示 了 我 们 将 要 讨论 无 线 数据 通信 和 移动 性 主题 的 环境 。 为 使 讨论 具有 一 般 性 
以 覆盖 各 种 各 样 的 网 络 ， 将 包括 像 
IEEE 802. 11 这 样 的 无 线 局 域 网 和 像 4G 
网 络 这 样 的 蜂窝 网 络 来 开始 我 们 的 讨 
论 ; 然后 在 后 续 各 节 中 ， 我 们 将 对 特定 
的 无 线 体系 结构 进行 更 加 详细 的 讨论 。 
我 们 能 够 看 到 无 线 网 络 的 下 列 要 素 : 
© 无 线 主机 。 如 同 在 有 线 网 络 中 
一 样 ， 主 机 是 运行 应 用 程序 的 
端 系 统 设备 。 无 线 主 机 ( wire- 
less host) 可 以 是 便携 机 、 和 掌上 
机 、 智 能 手机 或 者 桌面 计算 机 。 
主机 本 身 可 能 移动 ， 也 可 能 不 
移动 。 s 
。 无 线 链 路 。 主 机 通过 无 线 通信 BY SERPII 
链 路 (wireless communication link) 连接 到 一 个 基站 (定义 见 下 文 ) 或 者 男 一 台 无 
线 主机 。 不 同 的 无 线 链 路 技术 具有 不 同 的 传输 速率 和 能 够 传输 不 同 的 距离 。 图 7-2 
显示 了 较为 流行 的 无 线 链 路 标准 的 两 种 主要 特性 ( 禾 盖 区 域 和 链 路 速率 )。( 该 图 
仅 表示 了 提供 这 些 特性 的 大 致 概念 。 例如 ， 这 些 类 型 中 的 某 些 网 络 现在 只 是 在 部 
署 ， 某 些 链 路 速率 取决 于 距离 、 信 道 条 件 和 在 无 线 网 络 中 的 用 户 数量 ， 能 够 比 显 
示 的 值 更 高 或 更 低 些 。) 我 们 将 在 本 章 的 前 半 部 分 讨论 这 些 标准 。 在 7.2 节 中 , 我 
们 也 考虑 其 他 无 线 链 路 特性 〈 如 它们 的 比特 差错 率 及 其 原因 ) 。 
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图 7-2 部 分 无 线 网 络 标准 的 链 路 特性 
在 图 7-1 中 ， 无 线 链 路 将 位 于 网 络 边缘 的 主机 连接 到 更 大 的 网 络 基础 设施 中 。 我 
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们 要 马上 补充 的 是 ， 无线 链 路 有 时 同样 应 用 在 一 个 网 络 中 以 连接 路 由 器 、 交 换 机 和 其 他 网 
络 设备 。 然 而 ， 在 本 章 中 我 们 关注 的 焦点 是 无 线 通信 在 网 络 边 缘 的 应 用 ， 因 为 许多 最 为 振 
奋 人 心 的 技术 挑战 和 多 数 增 长 就 发 生 在 这 里 。 
e 基站 。 基 站 (base station) 是 无 线 网 络 基础 设施 的 一 个 关键 部 分 。 与 无 线 主机 和 
无 线 链 路 不 同 ， 基 站 在 有 线 网 络 中 没有 明确 的 对 应 设备 。 它 负责 回 与 之 关联 的 无 
线 主机 发 送 数据 和 从 主机 那里 接收 数据 (例如 分 组 )。 基 站 通常 负责 协调 与 之 相关 
联 的 多 个 无 线 主机 的 传输 。 当 我 们 说 一 台 无 线 主 机 与 某 基 站 “相关 联 ” 时 ， 则 是 
指 : 也 该 主机 位 于 该 基站 的 无 线 通 信和 覆盖 范围 内 ; 包 该 主机 使 用 该 基站 中 继 它 
(该 主机 ) 和 更 大 网 络 之 间 的 数据 。 蜂 窝 网络 中 的 蜂窝 塔 (cell tower) 和 802. 11 
无 线 LAN 中 的 接 入 点 (access point) 都 是 基站 的 例子 。 
在 图 7-1 中 ， 基 站 与 更 大 网 络 相 连 (如 因特网 、 公 司 或 家 庭 网 、 电 话 网 ) ， 因 此 这 种 
连接 在 无 线 主机 和 与 之 通信 的 其 他 部 分 之 间 起 着 链 路 层 中 继 的 作用 。 
与 基站 关联 的 主机 通常 被 称 为 以 基础 设施 模式 (infrastructure mode) 运行 ， 因 为 所 有 
传统 的 网 络 服务 (如 地 址 分 配 和 路 由 选择 ) 都 由 网 络 向 通过 基站 相连 的 主机 提供 。 在 自 组 
织 网 络 (ad hoc network) 中 ， 无 线 主 机 没有 这 样 的 基础 设施 与 之 相连 。 在 没有 这 样 的 基础 
设施 的 情况 下 ， 主 机 本 身 必 须 提 供 诸如 路 由 选择 、 地 址 分 配 、 类 似 于 DNS 的 名 字 转 换 等 
服务 。 
当 一 台 移 动 主机 的 移动 超出 一 个 基站 的 覆盖 范围 而 到 达 男 一 个 基站 的 覆盖 范围 后 ， 它 
将 改变 其 接 入 到 更 大 网 络 的 连接 点 ( 即 改 变 与 之 相关 联 的 基站 )， 这 一 过 程 称 作 切 换 
(handoff) 。 这 种 移动 性 引发 了 许多 具有 挑战 性 的 问题 。 如 果 一 台 主 机 可 以 移动 ， 那 么 如 何 
找到 它 在 网 络 中 的 当前 位 置 ， 从 而 使 得 数据 可 以 向 该 移动 主机 转发 ”如 果 一 台 主 机 可 以 位 
于 许多 可 能 位 置 中 的 一 个 ， 那 么 如 何 进行 编 址 ? 如 果 主 机 在 一 个 TCP 连接 或 者 电话 呼叫 期 
间 移 动 ， 数 据 如 何 路 由 选择 而 使 连接 保持 不 中 断 ? 这 些 以 及 许多 (许多 !) 其 他 问题 使 得 
无 线 网 络 和 移动 网 络 成 为 一 个 让 人 振奋 的 网 络 研 究 领域 。 
e 网 络 基础 设施 。 这 是 无 线 主机 希望 与 之 进行 通信 的 更 大 网 络 。 
在 讨论 完 无 线 网 络 的 构件 以 后 ,我们 注意 到 这 些 构件 能 够 以 多 种 不 同方 式 组 合 以 形成 
不 同类 型 的 无 线 网 络 。 当 阅读 本 章 ，, 或 阅读 /学 习 本 书 之 外 的 更 多 有 关 无 线 网 络 的 内 容 时 ， 
你 可 能 发 现 对 这 些 无 线 网 络 类 型 进行 分 类 的 方法 是 有 用 的 。 在 最 高 层次 ， 我 们 能 够 根据 两 
个 准则 来 对 无 线 网 络 分 类 : 中 在 该 无 线 网 络 中 的 分 组 是 否 跨越 了 一 个 无 线 跳 或 多 个 无 线 
跳 ; @ 网 络 中 是 否 有 诸如 基站 这 样 的 基础 设施 。 
e 单 跳 ， 基 于 基础 设施 。 这 些 网 络 具 有 与 较 大 的 有 线 网 络 〈 如 因特网 ) 连接 的 基站 。 
此 外 ， 该 基站 与 无 线 主机 之 间 的 所 有 通信 都 经 过 一 个 无 线 跳 。 你 在 教室 、 咖 啡 屋 
或 图 书馆 中 所 使 用 的 802. 11 网 络 ， 以 及 我 们 将 很 快 学 习 的 4G LTE 数据 网 络 都 属 
于 这 种 类 型 。 我 们 日 常 的 绝 大 部 分 时 间 是 在 与 单 跳 、 基 于 基础 设施 的 无 线 网 络 打 
交道 。 
© 单 跳 ， 无 基础 设施 。 在 这 些 网 络 中 ， 不 存在 与 无 线 网 络 相 连 的 基站 。 然 而 ， 如 我 
们 将 要 见 到 的 那样 ， 在 这 种 单 跳 网 络 中 的 一 个 节点 可 以 协调 其 他 节点 的 传输 。 蓝 
牙 网 络 〈 该 网 络 连接 诸如 键盘 、 扬 声 器 和 戴 在 头 上 的 耳机 等 小 型 无 线 设 备 ， 我 们 
将 在 7. 3.6 节 中 学 习 ) 和 具有 自 组 织 模式 的 802.11 网 络 是 单 跳 、 无 基础 设施 的 
网 络 。 

© 多 跳 ， 基 于 基础 设施 。 在 这 些 网 络 中 ， 一 个 基站 表现 为 以 有 线 方式 与 较 大 网 络 相 
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连 。 然 而 ， 某 种 无 线 节 点 为 了 经 该 基站 通信 ， 可 能 不 得 不 通过 其 他 无 线 节 点 中 继 
它们 的 通信 。 某 些 无 线 传 感 网 络 和 所 谓 无 线 网 状 网 络 (wireless mesh network) 就 
属于 这 种 类 型 。 

© 多 跳 ， 无 基础 设施 。 在 这 些 网 络 中 没有 基站 ， 并 且 节 点 为 了 到 达 目 的 地 可 能 必须 
在 几 个 其 他 无 线 节 点 之 间 中 继 报 文 。 节 点 也 可 能 是 移动 的 ， 在 多 个 节点 中 改变 连 
接 关系 ， 一 类 网 络 被 称 为 移动 自 组 织 网 络 ( mobile ad hoc network ，MANET ) 。 如 
果 该 移动 节点 是 车 载 的 ， 该 网 络 是 车 载 自 组 织 网 络 (vehicular ad hoc network, 
VANET) 。 如 你 可 能 想象 的 那样 ， 为 这 种 网 络 开发 协议 是 一 种 挑战 ， 这 是 许多 进行 
中 的 研究 主题 。 

在 本 章 中 ， 我 们 将 把 主要 学 习 内 容 限 制 在 单 跳 网 络 ， 并 且 大 多 数 是 基于 基础 设施 的 网 络 。 

现在 我 们 更 深 一 步 地 研究 无 线 网 络 和 移动 网 络 面 对 的 挑战 。 我 们 将 首先 讨论 单独 的 无 

线 链 路 ， 而 在 本 章 稍 后 部 分 讨论 移动 性 。 























公共 WIFI 接 入 : 路 灯 方 案 很 快 将 实现 吗 ? 


WiFi AE ( 即 用 户 能 够 找到 802. 11 无 线 接 入 的 公共 位 置 ) 在 全 世界 的 旅馆 、 机 场 
和 咖啡 屋 变 得 日 益 常 见 。 大 多 数 大 学 校园 提供 了 无 所 不 在 的 无 线 接 入 ， 找 一 个 不 提供 无 
线 因特网 接 入 的 旅馆 也 很 难 。 
| 在 过 去 的 十 年 中 ， 一些 城市 已 经 设计 、 部 署 和 运行 了 市 政 的 WiFi 网络。 作为 公共 
服务 (非常 像 街灯 ) 提供 无 所 不 在 的 WiFi 接 入 到 社区 的 前 景 引人入胜 ,通过 向 所 有 居 
| 民 提 供 因 特 网 接 入 ， 有 助 于 填 平 数字 鸿沟 ， 并 能 促进 经 济 发 展 。 世 界 上 的 许多 城市 ， 包 
| 括 费 城 、 香 港 、 明 尼 阿 波 利 斯 、 伦 敦 和 奥克兰 ， 已 经 计划 在 城市 中 提供 无 所 不 在 的 无 
线 ， 或 者 已 经 在 不 同 程度 上 做 到 了 这 一 点 。 美 国宾 夕 法 尼 亚 州 费城 的 目标 是 “将 费城 变 
为 国家 最 大 的 WiFi 热 区 ， 有 助 于 改善 教育 ， 填 平 数字 鸿沟 ， 增 强 邻 居 交 往 ， 以 及 减少 
政府 成 本 "。 这 项 雄心 勃勃 的 规划 依据 该 城市 、 无 线 费 城 〈 一 个 非 营利 组 织 ) 和 因特网 
服务 提供 商 Earthlink 达成 的 一 项 协议 ， 这 将 在 履 盖 城市 80% 区 域 的 街道 路 灯 杆 和 交通 
控制 设备 上 建设 一 个 802. 11b 热 区 的 运行 网 络 。 而 由 该 网 络 产生 的 金融 和 运行 股份 在 
2008 年 出 售 给 了 一 群 私 人 投资 者 ， 他 们 在 2010 年 再 将 该 网 络 回 售 给 该 城市 。 其 他 城市 
| 如 明 尼 阿 波 利 斯 、 多 伦 多 、 香 港 、 伦 敦 和 奥克兰 已 经 取得 了 较 小 规模 的 成 功 。 

运行 在 无 须 许 可 证 的 频谱 上 (因此 能 够 在 无 须 购买 昂贵 的 频谱 使 用 权 的 情况 下 部 
署 ) 的 802.11 网 络 看 起 来 使 其 在 资金 上 具有 吸引 力 。 然 而 ，802. 11 接 入 点 (参见 7.3 
OF) 比 起 4G 蜂 帘 基站 (参见 7.4 节 ) 缺少 大 量 的 频段 ， 要 求 部 署 大 量 的 端点 来 履 盖 相 
同 的 地 理 区 域 。 在 另 一 方面 ， 提 供 因特网 接 入 的 蜂窝 数据 网 络 运行 在 许可 证 频谱 上 。 蜂 
窟 提供 商 为 其 网 络 的 频谱 接 入 权 支 付 数 十 亿美 元 ， 使 得 蜂窝 数据 网 络 是 商务 而 不 是 市 政 
事务 。 











7.2 无 线 链 路 和 网 络 特征 
我 们 开始 考虑 用 一 人 台 有 线 以 太 网 交换 机 互联 主机 的 一 个 简单 有 线 网 络 ， 如 一 个 家 庭 网 
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络 (参见 6. 4 节 ) 。 如 果 我 们 用 无 线 802. 11 网 络 代替 该 有 线 以 太 网 ， 用 无 线 网 络 接口 代替 
主机 的 有 线 以 太 网 接口 ， 用 接 人 点 代替 以 太 网 交换 机 ， 但 实际 上 在 网 络 层 及 其 以 上 层次 中 
不 需要 有 任何 变化 。 这 提示 我 们 当 寻 找 有 线 和 无 线 网 络 的 重要 区 别 时 ， 应 该 重点 关注 链 路 
层 。 我 们 的 确 能 够 发 现 有 线 链 路 和 无 线 链 路 间 的 许多 重要 区 别 : 
。 递减 的 信号 强度 。 电 磁 波 在 穿 过 物体 ( 如 无 线 电 信号 穿 过 墙壁 ) 时 强度 将 减弱 。 
即使 在 自由 空间 中 ， 信 和 号 仍 将 扩散 ， 这 使 得 信号 强度 随 着 发 送 方 和 接收 方 距离 的 
增加 而 减弱 (有 时 称 其 为 路 径 损耗 (path loss) ) 。 
e 来 自 其 他 源 的 干扰 。 在 同一 个 频段 发 送信 号 的 电波 源 将 相互 干扰 。 例 如 ，2. 4CHz 无 
线 电话 和 802. 11b 无 线 LAN 在 相同 的 频段 中 传输 。 因 此 ，802. 11b 无 线 LAN 用 户 若 
同时 利用 2. 4GHz 无 线 电话 通信 ， 将 会 导致 网 络 和 电话 都 不 会 工作 得 特别 好 。 除 了 来 
自发 送 源 的 干扰 ， 环 境 中 的 电磁 噪声 ( 如 附近 的 电动 机 、 微 波 ) 也 能 形成 干扰 。 
o 多 径 传播 。 当 电磁 波 的 一 部 分 受 物体 和 地 面 反射 ， 在 发 送 方 和 接收 方 之 间 走 了 不 
同 长 度 的 路 径 ， 则 会 出 现 多 径 传播 (multipath propagation) 。 这 使 得 接收 方 收 到 的 
信和 号 变 得 模糊 。 位 于 发 送 方 和 接收 方 之 间 的 移动 物体 可 导致 多 径 传播 随时 间 而 
改变 。 
对 于 无 线 信道 特征 、 模 型 和 测量 的 详细 讨论 请 参见 [ Anderson 1995] 。 
上 述 讨论 表明 ， 无 线 链 路 中 的 比特 差错 将 比 有 线 链 路 中 更 为 常见 。 因 此 ， 无 线 链 路 协 
议 (如 我 们 将 在 下 面 一 节 中 讨论 的 802. 11 协议 ) 不 仅 采 用 有 效 的 CRC 错误 检测 码 ， 还 采 
用 了 链 路 层 ARQ 协议 来 重 传 受 损 的 帧 。 

考虑 了 在 无 线 信道 上 可 能 出 现 的 损伤 后 ， 我 们 将 注意 力 转 向 接收 无 线 信号 的 主机 。 

该 主机 接收 到 一 个 电磁 信号 ， 而 该 信号 是 发 送 方 传输 的 初始 信号 的 退化 形式 和 环境 中 的 
背景 噪声 的 结合 ， 其 中 的 信号 退化 是 由 于 训 减 和 我 们 前 面 讨论 过 的 多 路 径 传播 以 及 其 他 
一 些 因 素 所 引起 的 。 信 了 品 比 (Signal-to-Noise Ratio, SNR) 是 所 收 到 的 信号 (如 被 传输 
的 信息 ) 和 噪声 强度 的 相对 测量 。SNR 的 度量 单位 通常 是 分 贝 (dB) ， 有 人 认为 这 个 主 
要 由 电气 工程 师 所 使 用 的 度量 单位 会 使 计算 机 科学 家 迷惑 不 解 。 以 dB 度量 的 SNR 是 下 
列 比 值 的 20 倍 ， 即 接收 到 的 信号 的 振幅 与 噪声 的 振幅 的 以 10 为 底 的 对 数 的 比值 。 就 我 
们 的 讨论 目的 而 言 ， 我 们 仅 需要 知道 较 大 的 SNR 使 接收 方 更 容易 从 背景 噪声 中 提取 传 
输 的 信号 。 

图 7-3 (该 图 选 自 [Holland 2001]) 显示 | \ | 
了 三 种 不 同 的 调制 技术 的 比特 差错 率 (BER) \ ci oo 
(大 致 说 来 ，BER 是 在 接收 方 收 到 的 有 错 传输 — BPSK | 
比特 的 概率 ) 与 SNR 之 比 ， 这 些 调制 技术 用 于 0 ph \ 
对 信息 进行 编码 以 在 理想 信道 上 传输 。 调 制 和 | 
编码 理论 以 及 信号 提取 和 BER MRT ARBAB 
范围 (对 这 些 主 题 的 讨论 参见 [ Schwart 
1980] ) 。 尽 管 如 此 ， 图 7-3 显示 了 几 种 物理 层 的 
特征 ， 这 些 特征 对 于 理解 较 高 层 无 线 通信 协议 
是 重要 的 : | 
e 对 于 给 定 的 调制 方案 ，SNR AB, BER 0 10 20 30 40 
越 低 。 由 于 发 送 方 通过 增加 它 的 传输 功 SNR (dB) 
率 就 能 够 增加 SNR， 因 此 发 送 方 能 够 通 图 7-3 ”比特 差错 率 、 传 输 率 和 SNR 
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过 增加 它 的 传输 功率 来 降低 接收 到 差错 帧 的 概率 。 然 而 ， 注 意 到 当 该 功率 超过 某 
个 靖 值 时 ， 如 BER 从 10 一 降低 到 10 -”， 可 证 明 几 乎 不 会 有 实际 增益 。 增 加 传输 
功率 也 会 伴随 着 一 些 缺点 : 发 送 方 必须 消耗 更 多 的 能 量 (对 于 用 电池 供电 的 移动 
用 户 ， 这 一 点 非常 重要 ) ， 并 且 发 送 方 的 传输 更 可 能 干扰 另 一 个 发 送 方 的 传输 ( 参 
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图 7-4 隐藏 终端 问题 和 衰减 


e 对 于 给 定 的 SNR， 具 有 较 高 比特 传输 率 的 调制 技术 (无论 差错 与 否 ) 将 具有 较 高 
的 BER。 例 如 在 图 7-3 中 ， 对 于 10dB 的 SNR, BA 1Mbps 传输 速率 的 BPSK 调制 
具有 小 于 10 的 BER, MAA 4Mbps 传输 速率 的 QAM 16 调制 ，BER 是 10” ， 该 
值 太 高 而 没有 实际 用 处 。 然 而 ， 具 有 20dB 的 SNR, QAM 16 调制 具有 4Mbps 的 传 
输 速 率 和 10 一 的 BER， 而 BPSK 调制 具有 仅 1Mbps 的 传输 速率 和 一 个 低 得 “无 法 
在 图 上 表示 ”的 BER。 如 果 人 们 能 够 容忍 10 ”的 BER， 在 这 种 情况 下 由 QAM 16 
提供 的 较 高 的 传输 速率 将 使 它 成 为 首选 的 调制 技术 。 这 些 考虑 引出 了 我 们 下 面 描 
述 的 最 后 一 个 特征 。 

© 物理 层 调 制 技术 的 动态 选择 能 用 于 适 配 对 信道 条 件 的 调制 技术 。SNR (因此 BER) 
可 能 因 移 动 性 或 由 于 环境 中 的 改变 而 变化 。 在 蜂窝 数据 系统 中 以 及 在 802. 11 WiFi 
和 4G 蜂窝 数据 网 络 中 (我 们 将 在 7.3 节 和 7.4 节 中 学 习 ) 使 用 了 自 适 应 调制 和 编 
码 。 例 如 ， 这 使 得 对 于 给 定 的 信道 特征 选择 一 种 调制 技术 ， 在 受制 于 BER 约束 的 
前 提 下 提供 最 高 的 可 能 传输 速率 。 

有 线 和 无 线 链 路 之 间 的 差异 并 非 仅仅 只 有 较 高 的 、 时 变 的 误 比 特 率 这 一 项 。 前 面 讲 
过 在 有 线 广播 链 路 中 所 有 节点 能 够 接收 到 所 有 其 他 节点 的 传输 。 而 在 无 线 链 路 中 ， 人 情况 
并 非 如 此 简单 。 如 图 7-4 所 示 ， 假 设 站 点 A 正在 回 站 点 B 发 送 ， 同 时 假定 站 点 C 也 在 回 
站 点 B 传输 。 由 于 所 谓 的 隐藏 终端 问题 (hidden terminal problem), ， 即 使 A 和 5C 的 传输 
确实 是 在 目的 地 B 发 生 干 扰 ， 环 境 的 物理 阻挡 (例如, 一座 大 山 或 者 一 座 建 筑 ) 也 可 
能 会 妨碍 A ALC 互相 听 到 对 方 的 传输 。 这 种 情况 如 图 7-4a 所 示 。 第 二 种 导致 在 接收 方 
无 法 检测 的 碰撞 情况 是 ， 当 通过 无 线 媒 体 传播 时 信号 强度 的 衰减 (fading)。 图 7-4b 图 
示 了 这 种 情况 ，A 和 C 所 处 的 位 置 使 得 它们 的 信号 强度 不 足以 使 它们 相互 检测 到 对 方 的 
传输 ， 然 而 它们 的 传输 足以 强 到 在 站 点 B 处 相互 干扰 。 正 如 我 们 将 在 7.3 节 看 到 的 那 
样 ， 隐藏 终 端 问 题 和 衰减 使 得 多 路 访问 在 无 线 网 络 中 的 复杂 性 远 高 于 在 有 线 网 络 中 的 
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在 第 6 章 讲 过 ， 当 不 同 主机 使 用 一 个 共享 媒体 通信 时 ， 需 要 有 一 个 协议 来 保证 多 个 发 
送 方 发 送 的 信和 号 不 在 接收 方 互 相干 扰 。 在 第 6 章 中 ， 我 们 描述 了 3 类 媒体 访问 协议 : 信道 
划分 、 随 机 访问 和 轮流 。 码 分 多 址 (Code Division Multiple Access, CDMA) 属于 信道 划分 
协议 族 。 它 在 无 线 LAN 和 蜂窝 技术 中 应 用 很 广泛 。 由 于 CDMA 对 无 线 领 域 十 分 重要 ， 在 
后 面 小 节 中 对 具体 的 无 线 接 人 技术 进行 探讨 以 前 ， 我 们 首先 对 其 快速 地 浏览 一 下 。 

在 CDMA 协议 中 ， 要 发 送 的 每 个 比特 都 通过 乘 以 一 个 信号 〈 编 码 ) 的 比特 来 进行 编 
码 ， 这 个 信和 号 的 变化 速率 (通常 称 为 码 片 速率 ，chipping rate) 比 初始 数据 比特 序列 的 变 
化 速率 快 得 多 。 图 7-5 表示 一 个 简单 的 、 理 想 化 的 CDMA 编码 /解码 情形 。 假 设 初始 数据 
比特 到 达 CDMA 编码 器 的 速率 定义 了 时 间 单 元 ; 也 就 是 说 ， 每 个 要 发 送 的 初始 数据 比特 需 
要 1 比特 时 际 时 间 。 设 d; 为 第 i 个 比特 时 际 中 的 数据 比特 值 。 为 了 数学 上 便利 ,我 们 把 具 
有 0 值 的 数据 比特 表示 为 - 1。 每 个 比特 时 隙 又 进一步 细 分 为 M 个 微 时 际 ; 在 图 7-5 中 ， 
M =8， 不 过 在 实际 中 M 的 值 要 大 得 多 。 发 送 方 使 用 的 CDMA 编码 由 M 个 值 的 一 个 序列 cn 
组 成 ，m =1,…，M， 每 个 取 值 为 +1 或 者 -1。 在 图 7-5 的 例子 中 ， 被 发 送 方 使 用 的 M 
比特 的 CDMA 码 是 (1, 1, 1, -1, 1, -1, -1, -1). 






= s\ 


信道 输出 Z,。 
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图 7-5 一 个 简单 的 CDMA 例子 : 发 送 方 编码 ， 接 收 方 解 码 
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为 了 说 明 CDMA 的 工作 原理 ,我 们 关注 第 i 个 数据 比特 d 。 对 于 d; 比特 传输 时 间 
的 第 m THAT BR, CDMA 编码 器 的 输出 Zin 是 d; 乘 以 分 配 的 CDMA 编码 的 第 m 比 
特 Cn: 

Zim 三 人 (7-1) 

简单 地 说 ， 对 没有 干扰 的 发 送 方 ， 接收 方 将 收 到 编码 的 比特 过。 ， 并 且 恢 复 初 始 的 数 
据 比 特 d; ， 计 算 如 下 : 


1 M 
d, = MO Zim Cm (7-2) 


读者 可 能 想 通过 推敲 图 7-5 所 示例 子 的 细节 ， 来 明白 使 用 式 (7-2) 在 接收 方 确实 正确 恢 
复 了 初始 数据 比特 。 

然而 ， 这 个 世界 远 不 是 理想 化 的 ， 如 上 面 所 述 ，CDMA 必须 在 存在 干扰 发 送 方 的 情况 
下 工作 ， 这 些 发 送 方 用 分 配 的 不 同 编码 来 编码 和 传输 它们 的 数据 。 但 是 当 一 个 发 送 方 的 数 
据 比 特 和 其 他 发 送 方 发 送 的 比特 混在 一 起 时 ， 一 个 CDMA 接收 方 怎样 恢复 该 发 送 方 的 初始 
数据 比特 呢 ? CDMA 的 工作 有 一 种 假设 ， 即 对 干扰 的 传输 比特 信号 是 加 性 的 ， 这 意味 着 ， 
例如 在 同一 个 微 时 除 中 ， 如 果 3 个 发 送 端 都 发 送 1， 第 4 个 发 送 端 发 送 - 1， 那么 在 那个 微 
时 隙 中 所 有 的 接收 方 接收 的 信号 都 是 2〈 因 为 1+1+1-1=2)。 在 存在 多 个 发 送 方 时 ， 发 
送 方 s 计算 它 编码 后 的 传输 Z,, ， 计算 方 式 与 式 (7-1) 中 的 完全 相同 。 然 而 在 第 i 个 比特 
时 隙 的 第 m 个 微 时 际 期 间 ， 接 收 方 现在 收 到 的 值 是 在 那个 微 时 际 中 从 所 有 NN 个 发 送 方 传 
输 的 比特 的 总 和 : 


- È Zi, 
令 人 吃惊 的 是 ， 如 果 仔 细 地 选择 发 送 方 的 编码 ， 每 个 接收 方 只 通过 式 (7-2) 中 的 


同样 的 方式 使 用 发 送 方 的 编码 ， 就 能 够 从 聚合 的 信号 中 恢复 一 个 给 定 的 发 送 方 发 送 的 
数据 : 


FEZ, (7-3) 

如 在 图 7- Pa 描述 了 两 个 发 送 方 的 CDMA 例子 。 上 部 的 发 送 方 使 用 的 M 比特 
CDMA 编码 是 (1, 1, 1, -1, 1，-1，-1，-1)， 而 下 部 的 发 送 方 使 用 的 CDMA 编码 
Æ (1, =1y 1, 1, i -1, 1, 1), R 7-6 描述 了 一 个 接收 方 恢复 从 上 部 发 送 方 发 送 的 


初始 数据 比特 的 情况 。 注 意 到 这 个 接收 方 能 够 提取 来 自发 送 方 1 的 数据 ， 而 不 管 来 自发 送 
方 2 的 干扰 传输 。 

再 回 到 我 们 第 6 章 中 鸡尾酒 会 的 类 比 ， 一 个 CDMA 协议 类 似 于 让 聚会 客人 使 用 多 种 语 
言 来 谈论 ; 在 这 种 情况 下 ， 人 们 实际 上 非常 善于 锁定 他 们 能 听 懂 的 语言 的 谈话 ， 而 过 滤 了 
其 余 的 谈话 。 我 们 这 里 看 到 CDMA 是 一 个 划分 协议 ， 因 为 它 划分 编码 空间 〈 与 时 间或 频 
率 相 对 ) ， 并 且 给 每 个 节点 分 配 一 段 专用 的 代码 空间 。 

我 们 这 里 对 CDMA 的 讨论 是 简要 的 ; 实践 中 还 必须 处 理 大 量 的 困难 问题 。 首 先 ， 为 了 
使 CDMA 接收 方 能 够 提取 一 个 特定 的 发 送 方 的 信号 ， 必 须 仔 细 地 选择 CDMA 编码 。 其 次 ， 
我 们 的 讨论 假设 在 接收 方 接收 到 的 来 自从 不 同 发 送 方 的 信号 强度 是 相同 的 ; 这 可 能 在 实际 
中 很 难 获得 。 有 大 量 的 文章 讨论 了 有 关 CDMA 的 这 些 和 其 他 问题 ; 详细 内 容 见 [Pickholtz 
1982; Viterbi 1995 | 。 
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7-6 两 个 发 送 方 的 CDMA 例子 


7.3 WiFi: 802. 11 无 线 LAN 


当前 ， 无 线 LAN 在 工作 场所 、 家 庭 、 教 育 机 构 、 咖 啡 屋 、 机 场 以 及 街头 无 所 不 在 ， 
它 已 经 成 为 因特网 中 的 一 种 十 分 重要 的 接 人 网 技术 。 尽 管 在 20 世纪 90 年 代 研 发 了 许多 有 
KAZ LAN 的 标准 和 技术 ， 但 其 中 有 一 类 标准 已 经 明显 成 为 赢家 : IEEE 802.11 无 线 
LAN (也 称 为 WiFi) 。 在 本 节 中 ， 我 们 将 详细 研究 802. 11 无 线 LAN， 分 析 它 的 帧 结构 、 
它 的 媒体 访问 协议 以 及 802. 11 LAN 与 有 线 以 太 网 LAN 的 互联 。 

在 IEEE 802.11 (“WiFi”) 协议 族 中 有 几 套 有 关 无 线 LAN 的 802. 11 标准 ， 表 7-1 中 
对 它们 进行 了 总 结 。 不 同 的 802. 11 标准 都 具有 某 些 共同 的 特征 。 它 们 都 使 用 相同 的 媒体 
访问 协议 CSMAZCA ， 我 们 稍 后 将 讨论 该 协议 。 这 些 标 准 对 它们 的 链 路 层 帧 也 都 使 用 相同 
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的 帧 结构 ， 而 且 它 们 都 具有 减少 其 传输 速率 的 能 力 以 伸展 到 更 远 的 距离 。 并 且 重 要 的 是 ， 
802. 11 产品 也 都 是 向 后 兼容 的 ， 这 意味 着 例如 仅 支 持 802. 11g 的 移动 站 仍 可 以 与 较 新 的 
802. llac 基站 交互 。 


然而 ， 如 表 7-1 所 示 ， 这 些 标准 在 物理 表 7-1 IEEE 802. 11 标准 小 结 
层 有 一 些 重要 的 区 别 。802. 11 设备 工作 在 两 标准 数据 率 
个 不 同 的 频率 段 上 : 2.4 ~2.485GHz ( 称 之 802.11b | 2.4GHz | 最 高 为 11Mbps 
为 2.4GHz 频段 ) 和 5.1 ~5.8GHz ( 称 之 为 802. 11a 最 高 为 54Mbps 


5GHz 频段 ) 2.4GHz 频段 是 一 种 无 须 执照 802. 11g 最 高 为 54Mbps 

的 频段 ， 在 此 频段 上 ,使 用 2.4GHz 的 电话 802.11n 最 高 为 450Mbps 

和 微波 炉 等 802. 11 设备 可 能 会 争 用 该 频段 ”802.11a 最 高 为 1300Mbps 
的 频谱 。 在 5GHz 频段 ， 对 于 给 定 的 功率 等 

级 802. 11 LAN 有 更 短 的 传输 距离 ， 并 且 受 多 径 传 播 的 影响 更 多 。 两 种 最 新 的 标准 802. 11n 
| IEEE 802. 11n 2012] 和 802. 1lac [IEEE 802. llac 2013; Cisco 802. llac 2015] 使 用 多 输 
入 多 输出 (MIMO) KR; 也 就 是 说 在 发 送 一 侧 的 两 根 或 更 多 的 天 线 以 及 在 接收 一 侧 的 两 
根 或 更 多 的 天 线 发 送 /接收 着 不 同 的 信号 [ Diggavi 2004 ] 。802. 11ac 基站 可 以 同时 向 多 个 
站 点 传输 ， 并 且 使 用 “智能 ”天 线 在 接收 方 的 方向 上 用 自 适应 成 型 波束 向 目标 传输 。 这 减 
少 了 干扰 并 增 大 了 以 给 定数 据 率 传输 的 可 达 距 离 。 在 表 7-1 中 显示 的 数据 率 是 针对 理想 环 
境 的 数据 ， 例 如 一 个 离 基站 1 米 远 的 接收 方 没有 干扰 ， 而 这 种 场景 在 实践 中 是 不 可 能 经 历 
到 的 ! 因此 正如 谚语 所 说 : 你 走 过 的 路 (或 者 此 时 是 你 的 无 线 数据 率 ) 也 许 是 变化 的 
(YMMV). 


7.3.1 802.11 体系 结构 


图 7-7 显示 了 802. 11 无 线 LAN 体系 结构 的 基本 构件 。802. 11 体系 结构 的 基本 构件 模 
块 是 基本 服务 集 (Basic Service Set，BSS ) 。 一 个 BSS 包含 一 个 或 多 个 无 线 站 点 和 一 个 在 
802. 11 术语 中 称 为 接 入 点 (Access Point, AP) 的 中 央 基 站 (base station ) 。 图 7-7 展示 了 
两 个 BSS 中 的 AP， 它们 连接 到 一 个 互联 设备 上 〈 如 交换 机 或 者 路 由 器 ) ， 互 联 设备 又 连接 
到 因特网 中 。 在 一 个 典型 的 家 庭 网 络 中 ， 有 一 个 AP 和 一 台 将 该 BSS 连接 到 因特网 中 的 路 
由 器 (通常 综合 成 为 一 个 单元 )。 

与 以 太 网 设备 类 似 ， 每 个 802. 11 无 线 站 点 都 具有 一 个 6 字 节 的 MAC 地 址 ， 该 地 址 存 
MEZE Boat (BI 802.11 网 络 接口 卡 ) 的 固件 中 。 每 个 AP 的 无 线 接 口 也 具有 一 个 
MAC 地 址 。 与 以 太 网 类 似 ， 这 些 MAC 地 址 由 IEEE 管理 ， 理 论 上 是 全 球 唯一 的 。 

如 7.1 WAE, ME AP 的 无 线 LAN 经 常 被 称 作 基础 设施 无 线 LAN (infrastructure 
wireless LAN) ， 其 中 的 “基础 设施 ”是 指 AP 连同 互联 AP 和 一 台 路 由 器 的 有 线 以 太 网 。 
图 7-8 显示 了 IEEE 802. 11 站 点 也 能 将 它们 自己 组 合 在 一 起 形成 一 个 自 组 织 网 络 ， 即 一 个 
无 中 心 控制 和 与 “外 部 世界 ”无 连接 的 网 络 。 这 里 ， 该 网 络 是 由 彼此 已 经 发 现 相互 接近 和 且 
有 通信 和 需求 的 移动 设备 “动态 ”形成 ,并且 在 它们 所 处 环境 中 没有 预先 存在 的 网 络 基础 设 
施 。 当 携带 便携 机 的 人 们 聚集 在 一 起 时 (例如 ， 在 一 个 会 议 室 、 一 列 火 车 或 者 一 辆 汽车 
H), 并且 要 在 没有 中 央 化 的 AP 的 情况 下 交换 数据 ， 一 个 自 组 织 网 络 就 可 能 形成 了 。 随 
着 要 通信 的 便携 设备 的 继续 激增 ， 人 们 对 自 组 织 网 络 产 生 巨大 的 兴趣 。 然 而 在 本 节 中 ， 我 
们 只 关注 基础 设施 无 线 LAN。 
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图 7-7 IEEE 802.11 LAN 体系 结构 图 7-8 IEEE 802.11 自 组 织 网 络 


信道 与 关联 

在 802. 11 中 ， 每 个 无 线 站 点 在 能 够 发 送 或 者 接收 网 络 层 数据 之 前 ， 必 须 与 一 个 AP 相 
关联 。 尽 管 所 有 802. 11 标准 都 使 用 了 关联 ， 但 我 们 将 专门 在 IEEE 802. 11byg 环境 中 讨论 
这 一 主题 。 

当 网 络 管理 员 安装 一 个 AP 时， 管理 员 为 该 接 人 点 分 配 一 个 单字 或 双 字 的 服务 集 标识 
符 (Service Set Identifier，SSID ) 。( 例如， 当 你 在 iPhone 上 选择 设置 WiFi 时 ， 将 显示 某 范 
围 内 每 个 AP 的 SSID。) 管理 员 还 必须 为 该 AP 分 配 一 个 信道 号 。 为 了 理解 信道 号 ， 回 想 前 
面 讲 过 的 802. 11 运行 在 2.4 ~2.4835GHz 的 频段 中 。 在 这 个 85MHz 的 频段 内 ，802. 11 定 
义 了 11 个 部 分 重合 的 信道 。 当 且 仅 当 两 个 信道 由 4 个 或 更 多 信道 阳 开 时 它们 才 无 重 释 。 
特别 是 信道 1、6 和 11 的 集合 是 唯一 的 3 个 非 重 秋 信 道 的 集合 。 这 意味 着 管理 员 可 以 在 同 
一 个 物理 网 络 中 安装 3 个 802. 11b AP， 为 这 些 AP 分 配 信道 1、6 和 11， 然 后 将 每 个 AP 都 
连接 到 一 台 交 换 机 上 。 

既然 已 经 对 802. 11 信道 有 了 基本 了 解 ， 我 们 则 可 以 描述 一 个 有 趣 ( 且 并 非 完全 不 寻 
常 ) 的 情况 ， 即 有 关 WiFi 从 林 。WiFi 丛林 (WiFi jungle) 是 一 个 任意 物理 位 置 ， 在 这 里 
无 线 站 点 能 从 两 个 或 多 个 AP 中 收 到 很 强 的 信号 。 例 如 ， 在 纽约 城 的 许多 咖啡 馆 中 ， 无 线 
站 点 可 以 从 附近 许多 AP 中 选取 一 个 信号 。 其 中 一 个 AP 可 能 由 该 咖啡 迄 管理 ， 而 其 他 AP 
可 能 位 于 咖啡 馆 附 近 的 住宅 区 内 。 这 些 AP 中 的 每 一 个 都 可 能 位 于 不 同 的 子 网 中 ， 并 被 独 
立 分 配 一 个 信道 。 

现在 假定 你 带 着 自己 的 手机 、 平 板 电脑 或 便携 机 进入 这 样 一 个 WiFi 丛林 ， 寻 求 无 线 
因特网 接 人 和 一 个 蓝莓 松 饼 。 设 在 这 个 丛林 中 有 5 个 AP。 为 了 获得 因特网 接 人 ， 你 的 无 
线 站 点 需要 加 入 其 中 一 个 子 网 并 因此 需要 与 其 中 的 一 个 AP 相关 联 (associate), KEKER 
着 这 一 无 线 站 点 在 自身 和 该 AP 之 间 创 建 一 个 虚拟 线路 。 特 别 是 ， 仅 有 关联 的 AP 才 向 你 
的 无 线 站 点 发 送 数据 帧 ， 并 且 你 的 无 线 站 点 也 仅仅 通过 该 关联 AP 向 因特网 发 送 数据 帧 。 
然而 ， 你 的 无 线 站 点 是 如 何 与 某 个 特定 的 AP 相关 联 的 ? 更 为 根本 的 问题 是 ， 你 的 无 线 站 
点 是 如 何 知 道 哪个 AP 位 于 该 丛林 呢 ? 

802. 11 标准 要 求 每 个 AP 周期 性 地 发 送信 标 帧 (beacon frame) ， 每 个 信 标 帧 包括 该 AP 
的 SSID 和 MAC 地 址 。 你 的 无 线 站 点 为 了 得 知 正在 发 送信 标 巾 的 AP， 扫 描 11 个 信道 ， 找 
出 来 自 可 能 位 于 该 区 域 的 AP 所 发 出 的 信 标 帧 〈 其 中 一 些 AP 可 能 在 相同 的 信道 中 传输 ， 
即 这 里 有 一 个 丛林 ! ) 。 通 过 信 标 帧 了 解 到 可 用 AP 后， 你 〈 或 者 你 的 无 线 主 机 ) 选择 一 个 
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AP 用 于 关联 。 

802. 11 标准 没有 指定 选择 哪个 可 用 的 AP 进行 关联 的 算法 ; 该 算法 被 遗留 给 802. 11 
固件 和 无 线 主 机 的 软件 设计 者 。 通 常 ， 主 机 选择 接收 到 的 具有 最 高 信号 强度 的 信 标 帧 。 虽 
然 高 信号 强度 好 (例如 可 参见 图 7-3) ， 信 和 号 强度 将 不 是 唯一 决定 主机 接收 性 能 的 AP 特 
性 。 特 别 是 ， 所 选择 的 AP 可 能 具有 强 信号 ， 但 可 能 被 其 他 附属 的 主机 (将 需要 共享 该 AP 
的 无 线 带宽 ) 所 过 载 ， 而 某 未 过 载 的 AP 由 于 稍 弱 的 信号 而 未 被 选择 。 选 择 AP 的 一 些 可 
替代 的 方法 近来 已 被 提出 [Vasudevan 2005; Nicholson 2006; Sudaresan 2006 ] 。 有 关 信 号 
强度 如 何 测量 的 有 趣 而 朴实 的 讨论 参见 [Bardwell 2004 | 。 

扫描 信道 和 监听 信 标 帧 的 过 程 被 称 为 被 动 扫 描 (passive scanning) (参见 图 7-9a)。 无 
线 主机 也 能 够 执行 主动 扫描 (active scanning) ， 这 是 通过 癌 位 于 无 线 主机 范围 内 的 所 有 AP 
广播 探测 帧 完成 的 ， 如 图 7-9b 所 示 。AP 用 一 个 探测 响应 帧 应 答 探 测 请 求 帧 。 无 线 主机 则 
能 够 在 啊 应 的 AP 中 选择 某 AP 与 之 相关 联 。 





a) 被 动 扫描 
中 自 AP 发 送信 标 帧 Q9 自 Hl 广播 探测 请 求 帧 
COH1 向 选择 的 AP 发 送 关联 请 求 帧 @ 自 AP 发 送 探测 响应 
G@) 选 择 的 AP 向 H1 发 送 关联 响应 帧 (3H1 项 选择 的 AP 发 送 关 联 请 求 帧 


@ 选 择 的 AP 向 H1 发 送 关 联 的 响应 帧 
图 7-9 对接 入 点 的 主动 和 被 动 扫描 


选 定 与 之 关联 的 AP 后 ， 无 线 主机 向 AP 发 送 一 个 关联 请 求 帧 ， 并 且 该 AP 以 一 个 关联 
响应 帧 进行 响应 。 注 意 到 对 于 主动 扫描 需要 这 种 第 二 次 请 求 / 响 应 握手 ， 因 为 一 个 对 初始 
探测 请 求 帧 进行 响应 的 AP 并 不 知道 主机 选择 哪个 〈 可 能 多 个 ) 响应 的 AP 进行 关联 ， 这 
与 DHCP 客户 能 够 从 多 个 DHCP 服务 器 进行 选择 有 诸多 相同 之 处 〈 参 见 图 4-24), 一旦 与 
一 个 AP 关联 ， 该 主机 希望 加 入 该 AP 所 属 的 子 网 中 (以 4.3.3 节 中 的 IP 寻 址 的 意义 )。 
因此 。 该 主机 通常 将 通过 关联 的 AP 癌 该 子 网 发 送 一 个 DHCP 发 现 报 文 (BULA 4-24), 
以 获取 在 该 AP 子 网 中 的 一 个 IP 地 址 。 一 旦 获得 地 址 ， 网 络 的 其 他 部 分 将 直接 视 你 的 主机 
为 该 子 网 中 的 男 一 台 主 机 。 

为 了 与 特定 的 AP 创建 一 个 关联 ， 某 无 线 站 点 可 能 要 向 该 AP 鉴别 它 自身 。802. 11 
无 线 LAN 提供 了 几 种 不 同 的 鉴别 和 接 人 方法 。 一 种 被 许多 公司 采用 的 方法 是 ， 基 于 一 
个 站 点 的 MAC 地址 允许 其 接 人 一 个 无 线 网 络 。 第 二 种 被 许多 因特网 咖啡 屋 采用 的 方法 
是 ， 应 用 用 户 名 和 口令 。 在 两 种 情况 下 ，AP 通常 与 一 个 鉴别 服务 器 进行 通信 ， 使 用 一 
种 诸如 RADIUS[ RFC 2865] 或 DIAMETER[ RFC 3588] 的 协议 ,在 无 线 终端 站 和 鉴别 
服务 器 之 间 中 继 信 息 。 分 离 鉴 别 服务 器 和 AP, 使 得 一 个 鉴别 服务 器 可 以 服务 于 多 个 
AP, 将 (经 常 是 敏感 的 ) 鉴别 和 接 入 的 决定 集中 到 单一 服务 器 中 ,使 AP 费用 和 复杂 性 
较 低 。 我 们 将 在 第 8 章 看 到 ， 定 义 802. 11 协议 族 安 全 性 的 新 IEEE 802. 11i 协议 就 恰好 
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来 用 本 这 二 方法。 
7.3.2 802.11 MAC 协议 


一 旦 某 无 线 站 点 与 一 个 AP 相关 联 ， 它 就 可 以 经 该 接 入 点 开始 发 送 和 接收 数据 帧 。 
然而 因为 许多 无 线 设备 或 AP 自身 可 能 和 布 望 同 时 经 过 相同 信道 传输 数据 帧 ， 因 此 需要 一 
个 多 路 访问 协议 来 协调 传输 。 下 面 ， 我 们 将 无 线 设 备 或 AP 称 为 站 点 (station) ， 它 们 共 
享 多 个 接 人 信道 。 正 如 在 第 6 章 和 7.2. 1 节 中 讨论 的 那样 ， 宽 泛 地 讲 有 三 类 多 路 访问 协 
议 : 信道 划分 (包括 CDMA) 、 随 机 访问 和 轮流 。 受 以 太 网 及 其 随机 访问 协议 巨大 成 功 
的 激励 ，802. 11 的 设计 者 为 802. 11 无 线 LAN 选择 了 一 种 随机 访问 协议 。 这 个 随机 访问 
协议 称 作 带 碰 撞 避 免 的 CSMA (CSMA with collision avoidance) ， 或 简称 为 CSMA/CA. 
与 以 太 网 的 CSMA/CD 相似 ，CSMA/CA 中 的 “CSMA” 代 表 “ 载 波 侦 听 多 路 访问 ”， 意 
味 着 每 个 站 点 在 传输 之 前 侦 听 信道 ， 并 且 一 旦 侦 听 到 该 信道 忙 则 抑制 传输 。 尽 管 以 太 网 
和 802. 11 都 使 用 载波 侦 听 随机 接 人 ， 但 这 两 种 MAC 协议 有 重要 的 区 别 。 首 先 ，802. 11 
使 用 碰撞 避免 而 非 碰 撞 检 测 。 其 次 ， 由 于 无 线 信道 相对 较 高 的 误 比 特 率 ，802. 11 (不 同 
FARR) 使 用 链 路 层 确认 / 重 传 (ARQ) 方案 。 我 们 将 在 下 面 讨论 802. 11 的 碰撞 避 
免 和 链 路 层 确认 机 制 。 
在 6.3.2 节 和 6.4.2 节 曾 讲 过 ， 使 用 以 太 网 的 碰撞 检测 算法 ， 以 太 网 节点 在 发 送 过 程 
中 监听 信道 。 在 发 送 过 程 中 如 果 检 测 到 男 一 节点 也 在 发 送 ， 则 放弃 自己 的 发 送 ， 并 且 在 等 
待 一 个 小 的 随机 时 间 后 再 次 发 送 。 与 802. 3 以 太 网 协议 不 同 ，802. 11MAC 协议 并 未 实现 碰 
撞 检 测 。 这 主要 由 两 个 重要 的 原因 所 致 : 
。 检测 碰撞 的 能 力 要 求 站 点 具有 同时 发 送 ( 站 点 自己 的 信号 ) 和 接收 (检测 其 他 站 
点 是 否 也 在 发 送 ) 的 能 力 。 因 为 在 802. 11 适配器 上 ， 接 收 信和 号 的 强度 通常 远 远 小 
于 发 送信 号 的 强度 ， 制 造 具 有 检测 碰撞 能 力 的 硬件 代价 较 大 。 

e 更 重要 的 是 ， 即 使 适配器 可 以 同时 发 送 和 监听 信号 〈 并 且 假 设 它 一 旦 侦 听 到 信道 
忙 就 放弃 发 送 ) ， 适 配器 也 会 由 于 隐藏 终端 问题 和 衰减 问题 而 无 法 检测 到 所 有 的 碰 
撞 ， 参 见 7. 2 节 的 讨论 。 

由 于 802. 11 无 线 局 域 网 不 使 用 碰撞 检测 ， 一 旦 站 点 开始 发 送 一 个 帧 ， 它 就 完全 地 发 
送 该 帧 ; 也 就 是 说 ， 一 旦 站 点 开始 发 送 ， 就 不 会 返回 。 正 如 人 们 可 能 猜想 的 那样 ， 碰 撞 存 
在 时 仍 发 送 整个 数据 帧 〈 尤 其 是 长 数据 帧 ) 将 严重 降低 多 路 访问 协议 的 性 能 。 为 了 降低 碰 
撞 的 可 能 性 ，802. 11 采用 几 种 碰撞 避免 技术 ， 我 们 稍 后 讨论 它们 。 

然而 ， 在 考虑 碰撞 避免 之 前 ， 我 们 首先 需要 分 析 802. 11 的 链 路 层 确 认 (1link-layer 
acknowledgment) 方案 。7. 2 节 讲 过 ， 当 无 线 LAN 中 某 站 点 发 送 一 个 帧 时 ， 该 帧 会 由 于 多 
种 原因 不 能 无 损 地 到 达 目 的 站 点 。 为 了 处 理 这 种 不 可 忽视 的 故障 情况 ，802. 11 MAC 使 用 
链 路 层 确 认 。 如 图 7-10 所 示 ， 目 的 站 点 收 到 一 个 通过 CRC 校 验 的 帧 后 ， 它 等 竺 一 个 被 称 
作 短 帧 间 间 隔 (Short Inter- Frame Spacing, SIFS) 的 一 小 段 时 间 ， 然 后 发 回 一 个 确认 帧 。 
如 果 发 送 站 点 在 给 定 的 时 间 内 未 收 到 确认 帧 ， 它 假定 出 现 了 错误 并 重 传 该 帧 ， 使 用 CS- 
MA/CA 协议 访问 该 信道 。 如 果 在 若干 固定 次 重 传 后 仍 未 收 到 确认 ， 发 送 站 点 将 放弃 发 送 
HEF ZW, 

讨论 过 802. 11 如 何 使 用 链 路 层 确 认 后 ， 我 们 可 以 描述 802.11 的 CSMA/CA 协议 了 。 
假设 一 个 站 点 (无 线 站 点 或 者 AP) 有 一 个 帧 要 发 送 。 

1) 如 果 某 站 点 最 初 监听 到 信道 空间 ， 它 将 在 一 个 被 称 作 分 布 式 帧 间 间 隔 (Distributed 
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Inter-Frame Space, DIFS) 的 短 时 间 段 后 发 送 该 帧 ， 如 图 7-10 所 示 。 
2) 否则 ， 该 站 点 选取 一 个 随机 回 退 值 (如 我 y 
们 在 6.3.2 节 中 遇 到 的 那样 ) 并 且 在 侦 听 信道 空闲 


q Cary CP» 
时 递减 该 值 。 当 侦 听 到 信道 忙 时 ， 计 数值 保持 a a 
不 变 。 


3) 当 计 数值 减 为 0 时 (注意 到 这 只 可 能 发 生 DIFs| : 
在 信道 被 侦 听 为 空闲 时 ) ， 该 站 点 发 送 整个 数据 帧 
并 等 待 确认 。 

4) 如 果 收 到 确认 ， 发 送 站 点 知道 它 的 帧 已 被 
目的 站 正确 接收 了 。 如 果 该 站 点 要 发 送 另 一 帧 ， 它 
将 从 第 二 步 开 始 CSMA/CA 协议 。 如 果 未 收 到 确 
认 ， 发 送 站 点 将 重新 进入 第 二 步 中 的 回 退 阶段 ， 并 
从 一 个 更 大 的 范围 内 选取 随机 值 。 

前 面 讲 过 ， 在 以 太 网 的 CSMA/CD 的 多 路 访问 : :| SIFS 
协议 (6.3.2 节 ) F, 一旦 侦 听 到 信道 空闲 ， 站 点 ra 
开始 发 送 。 然 而 ， 使 用 CSMA/CA， 该 站 点 在 倒 计 
数 时 抑制 传输 ， 即 使 它 侦 听 到 该 信道 空闲 也 是 如 
此 。 为 什么 CSMA/CD 和 CSMA/CA 采用 了 不 同 的 4 ee 
方法 呢 ? 

为 了 回答 这 一 问题 ， 我 们 首先 考虑 这 样 一 种 情 
形 ， 两 个 站 点 分 别 有 一 个 数据 帧 要 发 送 ， 但 是 , 由 图 7-10 802 11 使 用 链 路 层 确认 
于 侦 听 到 第 三 个 站 点 已 经 在 传输 ， 双 方 都 未 立即 发 送 。 使 用 以 太 网 的 CSMA/CD 协议 中 ， 
两 个 站 点 将 会 在 检测 到 第 三 方 发 送 完毕 后 立即 开始 发 送 。 这 将 导致 一 个 碰撞 ， 在 CSMA/ 
CD 协议 中 碰撞 并 非 是 一 个 严重 的 问题 ， 因 为 两 个 站 点 检测 到 碰撞 后 都 会 放弃 它们 的 发 送 ， 
从 而 避免 了 由 于 碰撞 而 造成 的 该 帧 剩余 部 分 的 无 用 发 送 。 而 在 802. 11 中 情况 却 十 分 不 同 ， 
因为 802. 11 并 不 检测 碰撞 和 放弃 发 送 ， 遭 受 碰撞 的 帧 仍 将 被 完全 传输 。 因 此 802.11 WA 
标 是 无 论 如 何 尽 可 能 避免 碰撞 。 在 802. 11 中 ， 如 果 两 个 站 点 侦 听 到 信道 忙 ， 它 们 都 将 立 
即 进入 随机 回 退 ， 希 望 选 择 一 个 不 同 的 回 退 值 。 如 果 这 些 值 的 确 不 同 ， 一 旦 信道 空闲 ， 其 
中 的 一 个 站 点 将 在 另 一 个 之 前 发 送 ， 并 且 (如 果 两 个 站 点 均 未 对 对 方 隐藏 ) “失败 站 点 ” 
将 会 听 到 “胜利 站 点 ”的 信号 ， 冻 结 它 的 计数 器 ， 并 在 胜利 站 点 完成 传输 之 前 一 直 抑 制 传 
输 。 通 过 这 种 方式 ， 避 免 了 高 代价 的 碰撞 。 当 然 ， 在 以 下 情况 下 使 用 802. 11 仍 可 能 出 现 
碰撞 : 两 个 站 点 可 能 互相 是 隐藏 的 ， 或 者 两 者 可 能 选择 了 非常 靠近 的 随机 回 退 值 使 来 自 
先 开 始 站 点 的 传输 也 必须 到 达 第 二 个 站 点 。 回 想 jie 
前 面 我 们 在 图 6-12 的 环境 中 讨论 随机 访问 算法 时 
遇 到 过 这 个 问题 。 

1. 处理 隐 藏 终端 ， RTS 和 CTS 


802. 11 MAC 协议 也 包括 了 一 个 极 好 (但 为 可 
选项 ) 的 预约 方案 ， 以 帮助 在 出 现 隐藏 终端 的 情 
况 下 避免 碰撞 。 我 们 在 图 7-11 的 环境 下 研究 这 种 














图 7-11 隐藏 终端 的 例子 : HI 和 H2 
方案 ,其 中 显示 了 两 个 无 线 站 点 和 一 个 接 入 点 。 彼此 互相 隐藏 
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这 两 个 无 线 站 点 都 在 该 AP 的 覆盖 范围 内 〈 其 覆盖 范围 显示 为 阴影 圆 环 ) ， 并 且 两 者 都 与 
该 AP 相关 联 。 然 而 ， 由 于 衰减 ， 无 线 节点 的 信号 范围 局 限 在 图 7-11 所 示 的 阴影 圆 环 内 
部 。 因 此 ， 尽 管 每 个 无 线 站 点 对 AP 都 不 隐藏 ， 两 者 彼此 却 是 隐藏 的 。 

现在 我 们 考虑 为 什么 隐藏 终端 会 导致 出 现 问 题 。 假 设 站 点 Hl 正在 传输 一 个 帧 ， 并 且 
在 Hl 传输 的 中 途 ， 站 点 H2 Ze AP 发 送 一 个 帧 。 由 于 H2 未 听 到 来 自 Hl 的 传输 ， 它 将 
首先 等 待 一 个 DIFS 间隔 ， 然 后 发 送 该 帧 ， 导 致 产生 了 一 个 碰撞 。 从 而 在 Hl 和 H2 的 整个 
发 送 阶 段 ， 信 道 都 被 浪费 了 。 


为 了 避免 这 一 问题 ，IEEE 802. 11 协 源 所 有 其 他 节点 
议 允 许 站 点 使 用 一 个 短 请 求 发 送 (Request “2 ei 
to Send, RTS) 控制 帧 和 一 个 短 允 许 发 送 a = a a 


(Clear to Send, CTS) 控制 帧 来 预约 对 信 DiFs 二 : 
道 的 访问 。 当 发 送 方 要 发 送 一 个 DATA W : 
时 ， 它 能 够 首先 向 AP 发 送 一 个 RTS W, 
指示 传输 DATA 帧 和 确认 (ACK) 帧 需要 
的 总 时 间 。 当 AP 收 到 RTS 帧 后 ， 它 广播 
一 个 CTS 帧 作为 响应 。 该 CTS 帧 有 两 个 目 
的 : 给 发 送 方 明确 的 发 送 许 可 ， 也 指示 其 srFs 二 : 
他 站 点 在 预约 期 内 不 要 发 送 。 : 

因此 ， 在 图 7-12 中 ， 在 传输 DATA 帧 
AY, Hl 首先 广播 一 个 RTS 帧 ， 该 帧 能 被 
其 范围 内 包括 AP 在 内 的 所 有 站 点 听 到 。 
AP 然后 用 一 个 CTS 帧 响应 ， 该 帧 也 被 其 
范围 内 包括 Hl 和 H2 在 内 的 所 有 站 点 听 
到 。 站 点 H2 听 到 CTS 后 ,在 CTS 帧 中 指 
明 的 时 间 内 将 抑制 发 送 。RIS、CTS、 ‘pie : : 
DATA 和 ACK 帧 如 图 7-12 所 示 。 : ; ; 





RTS 和 CTS 帧 的 使 用 能 够 在 两 个 重要 图 7-12 ”使 用 RTS 和 CTS 帧 的 碰撞 避免 
方面 提高 性 能 : 


© 隐藏 终端 问题 被 缓解 了 ， 因 为 长 DATA 帧 只 有 在 信道 预约 后 才 被 传输 。 
e 因为 RTS 和 CTS 帧 较 短 ， 涉 及 RTS 和 CTS 帧 的 碰撞 将 仅 持续 短 RTS 和 CTS 帧 的 
持续 期 。 一 旦 RTS 和 CTS 帧 被 正确 传输 ， 后 续 的 DATA 和 ACK 帧 应 当 能 无 碰撞 地 
发 送 。 
建议 读者 去 查看 本 书 配 套 网 站 上 的 802.11 Java 程序 。 这 个 交互 式 程序 演示 了 
CSMA/CA 协议 ,包括 RTS/CTS 交换 序列 。 
尽管 RTS/CTS 交换 有 助 于 降低 碰撞 ， 但 它 同样 引入 了 时 延 以 及 消耗 了 信道 资源 。 因 
It, RTS/CTS 交换 仅仅 用 于 为 长 数据 帧 预约 信道 。 在 实际 中 ， 每 个 无 线 站 点 可 以 设置 一 个 
RTS 门限 值 ， 仅 当 帧 长 超过 门限 值 时 ， 才 使 用 RTS/CTS 序列 。 对 许多 无 线 站 点 而 言 ， 默 
认 的 RTS 门限 值 大 于 最 大 帧 长 值 ， 因 此 对 所 有 发 送 的 DATA Wi, RTS/CTS 序列 都 被 跳 过 。 


2. 使 用 802. 11 作为 一 个 点 对 点 链 路 
到 目前 为 止 我 们 的 讨论 关注 在 多 路 访问 环境 中 使 用 802. 11。 应 该 指出 ， 如 果 两 个 节点 
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每 个 都 具有 一 个 定向 天 线 ， 它们 可 以 将 其 定向 天 线 指向 对 方 ， 并 基本 上 是 在 一 个 点 对 点 的 
链 路 上 运行 802. 11 协议 。 如 果 商 用 802. 11 硬件 产品 价格 低廉 ， 那 么 使 用 定向 天 线 以 及 增 
加 传输 功率 使 得 802. 11 成 为 一 个 在 数 十 公里 距离 中 提供 无 线 点 对 点 连接 的 廉价 手段 。 
[ Raman 2007] 描述 了 这 样 一 个 运行 于 印度 恒 河 郊区 平原 上 的 多 跳 无 线 网 络 ， 其 中 包含 了 
点 对 点 802. 11 链 路 。 
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尽管 802. 11 帧 与 以 太 网 帧 有 许多 共同 特点 ， 但 它 也 包括 了 许多 特定 用 于 无 线 链 路 的 
字段 。8021. 11 帧 如 图 7-13 所 示 ， 在 该 帧 上 的 每 个 字段 上 面 的 数字 代表 该 字段 以 字 节 计 的 
KE; 在 该 帧 控制 字段 中 ， 每 个 子 字段 上 面 的 数字 代表 该 子 字段 以 比特 计 的 长 度 。 现 在 我 
们 查看 该 帧 中 各 字段 以 及 帧 控制 字段 中 一 些 重要 的 子 字 段 。 

帧 数字 代表 该 字段 的 字 节 长 度 ) 
2 2 6 6 6 2 6 0~2312 © 4 
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1. 有 效 载荷 与 CRC 字段 

帧 的 核心 是 有 效 载荷 ， 它 通常 是 由 一 个 IP 数据 报 或 者 ARP 分 组 组 成 。 尽 管 这 一 字段 
允许 的 最 大 长 度 为 2312 字 节 ， 但 它 通常 小 于 1500 字 节 ， 放 置 一 个 IP 数据 报 或 一 个 ARP 
分 组 。 如 同 以 太 网 帧 一 样 ，802. 11 帧 包括 一 个 循环 元 余 校 验 (CRC) ， 从 而 接收 方 可 以 检 
测 所 收 到 帧 中 的 比特 错误 。 如 我 们 所 看 到 的 那样 ， 比 特 错 误 在 无 线 局 域 网 中 比 在 有 线 局 域 
网 中 更 加 普遍 ， 因 此 CRC 在 这 里 更 加 有 用 。 

2. 地 址 字段 


也 许 802. 11 帧 中 最 引 人 注 意 的 不 同 之 处 是 它 具 有 4 个 地 址 字段 ， 其 中 每 个 都 可 以 包 
含 一 个 6 字 节 的 MAC 地 址 。 但 为 什么 要 4 个 地 址 字段 呢 ? 如 以 太 网 中 那样 ， 一 个 源 MAC 
地 址 字段 和 一 个 目的 MAC 地 址 字段 不 就 足够 了 ? 事实 表明 ， 出 于 互联 目的 需要 3 个 地 址 
字段 ， 特 别 是 将 网 络 层 数据 报 从 一 个 无 线 站 点 通过 一 个 AP 送 到 一 台 路 由 器 接口 。 当 AP 
在 自 组 织 模式 中 互相 转发 时 使 用 第 四 个 地 址 。 由 于 我 们 这 里 仅仅 考虑 基础 设施 网 络 ， 所 以 
只 关注 前 3 个 地 址 字段 。802. 11 标准 定义 这 些 字 段 如 下 : 
o 地 址 2 是 传输 该 帧 的 站 点 的 MAC 地 址 。 因 此 ， 如 果 一 个 无 线 站 点 传输 该 帧 ， 该 站 
点 的 MAC 地 址 就 被 插入 在 地 址 2 字段 中 。 类 似 地 ， 如 果 一 个 AP 传输 该 帧 ， 该 AP 
的 MAC 地 址 也 被 插入 在 地 址 2 字段 中 。 
e 地 址 1 是 要 接收 该 帧 的 无 线 站 点 的 MAC 地 址 。 因 此 ， 如 果 一 个 移动 无 线 站 点 传输 
该 帧 ， 地 址 1 包含 了 该 目的 AP 的 MAC 地 址 。 类 似 地 ， 如 果 一 个 AP 传输 该 帧 ， 
地 址 1 包含 该 目的 无 线 站 点 的 MAC 地址。 
e 为 了 理解 地 址 3， 回 想 BSS (由 AP 和 无 线 站 点 组 成 ) 是 一 个 子 网 的 一 部 分 ， 并 且 这 个 
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子 网 经 一 些 路 由 器 接口 与 其 他 子 网 相连 。 地 址 3 包含 这 个 路 由 器 接口 的 MAC 地 址 。 

为 了 对 地 址 3 的 目的 有 更 深入 的 理解 ， 
我 们 观察 在 图 7-14 环境 中 的 网 络 互联 的 例 
子 。 在 这 幅 图 中 ， 有 两 个 AP， 每 个 AP fi 
责 一 些 无 线 站 点 。 每 个 AP 到 路 由 器 有 一 
个 直接 连接 ， 路 由 器 依次 又 连接 到 全 球 因 
特 网 。 我 们 应 当 记 住 AP 是 链 路 层 设 备 ， 
它 既 不 能 “说 ”了 P 又 不 理解 PP 地址。 现 
在 考虑 将 一 个 数据 报 从 路 由 器 接口 R1 移 
到 无 线 站 点 HI 。 路 由 器 并 不 清楚 在 它 和 
H1 之 间 有 一 个 AP; 从 路 由 器 的 观点 来 说 ， | 
HI 仅仅 是 路 由 器 所 连接 的 子 网 中 的 一 台 





主机 。 图 7-14 在 802. 11 帧 中 使 用 地 址 字段 : 
o 路 由 器 知道 Hl Wh IP Heat (从 数 在 Hl 和 RI 之 间 发 送 帧 


据 报 的 目的 地 址 中 得 到 ) ， 它 使 用 ARP 来 确定 Hl 的 MAC 地 址 ， 这 与 在 普通 的 以 
K LAN 中 相同 。 获 取 H1 的 MAC 地 址 后 ， 路 由 器 接口 RI 将 该 数据 报 封 装 在 一 
个 以 太 网 帧 中 。 该 帧 的 源 地 址 字段 包含 了 R1 的 MAC 地 址 ， 目 的 地 址 字段 包含 HI] 
的 MAC 地 址 。 

© 当 该 以 太 网 帧 到 达 AP 后 ， 该 AP 在 将 其 传输 到 无 线 信道 前 ， 先 将 该 802. 3 WAM 
帧 转换 为 一 个 802.11 帧 。 如 前 所 述 ，AP 将 地 址 1 和 地 址 2 分 别 填 上 H1 的 MAC 
地 址 和 其 自身 的 MAC 地 址 。 对 于 地 址 3，AP 插入 RI 的 MAC 地 址 。 通 过 这 种 方 
式 ，Hl 可 以 确定 (从 地 址 3) 将 数据 报 发 送 到 子 网 中 的 路 由 器 接口 的 MAC 地 址 。 

现在 考虑 在 从 Hl 移动 一 个 数据 报到 R 的 过 程 中 无 线 站 点 Hl 进行 响应 时 发 生 的 情况 。 

e Hl 生成 一 个 802. 11 Wi, Wn ETR, 4al HH AP 的 MAC 地 址 和 H1 的 MAC 地 址 填 
充 地 址 1 和 地 址 2 字段 。 对 于 地 址 3，HIl 插入 R1 的 MAC 地 址 。 

e 当 AP 接收 该 802. 11 帧 后 ， 将 其 转换 为 以 太 网 帧 。 该 帧 的 源 地 址 字段 是 Hl 的 
MAC 地 址 ， 目 的 地 址 字段 是 R1 的 MAC 地 址 。 因 此 ， 地 址 3 允许 AP 在 构建 以 太 
网 帧 时 能 够 确定 目的 MAC 地 址 。 

总 之 ， 地 址 3 在 BSS 和 有 线 局 域 网 互联 中 起 着 关键 作用 。 

3. 序号 、 持 续 期 和 帧 控制 字段 


前 面 讲 过 在 802. 11 网 络 中 ， 无 论 何 时 一 个 站 点 正确 地 收 到 一 个 来 目 于 其 他 站 点 的 帧 ， 
它 就 回 发 一 个 确认 。 因 为 确认 可 能 会 丢失 ， 发 送 站 点 可 能 会 发 送 一 个 给 定 帧 的 多 个 副本 。 
正如 我 们 在 rd2. 1 协议 讨论 中 所 见 (3.4.10 节 )， 使 用 序号 可 以 使 接收 方 区 分 新 传输 的 帧 
和 以 前 帧 的 重 传 。 因 此 在 802. 11 帧 中 的 序号 字段 在 链 路 层 与 在 第 3 章 中 运输 层 中 的 该 字 
段 有 着 完全 相同 的 目的 。 

前 面 讲 过 802. 11 协议 允许 传输 节点 预约 信道 一 段 时 间 ， 包 括 传输 其 数据 帧 的 时 间 和 
传输 确认 的 时 间 。 这 个 持续 期 值 被 包括 在 该 帧 的 持续 期 字段 中 〈 在 数据 帧 和 RTS 及 CTS 
帧 中 均 存 在 ) 。 

如 图 7-13 所 示 ， 帧 控制 字段 包括 许多 子 字 段 ， 我 们 将 提 一 下 其 中 比较 重要 的 子 字 段 ， 
更 加 完整 的 讨论 请 参见 802. 11 规范 [Held 2001; Crow 1997; IEEE 802.11 1999 ] 。 类 型 和 
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子 类 型 字段 用 于 区 分 关联 、RTS、CTS、ACK 和 数据 帧 。To (到 ) Al From (M) 字段 用 于 
定义 不 同 地 址 字段 的 含义 。( 这些 含义 随 着 使 用 上 自 组 织 模式 或 者 基础 设施 模式 而 改变 ， 而 
且 在 使 用 基础 设施 模式 时 ， 也 随 着 是 无 线 站 点 还 是 AP 在 发 送 帧 而 变化 。) 最 后 ，WEP F 
段 指示 了 是 否 使 用 加 密 (WEP 将 在 第 8 章 中 讨论 。) 


7.3.4 在 相同 的 1IP 子 网 中 的 移动 性 


为 了 增加 无 线 LAN 的 物理 范围 ， 公 司 或 大 学 经 常会 在 同一 个 IP 子 网 中 部 署 多 个 BSS, 
这 上 自然 就 引出 了 在 多 个 BSS 之 间 的 移动 性 问题 ， 即 无 线 站 点 如 何在 维持 进行 中 的 TCP 会 话 
的 情况 下 ， 无 颖 地 从 一 个 BSS 移动 到 另 一 个 BSS? 正如 我 们 将 在 本 小 节 中 所 见 ， 当 这 些 
BSS 属于 同一 子 网 时 ， 移 动 性 可 以 用 一 种 相对 直接 的 方式 解决 。 当 站 点 在 不 同 子 网 间 移 动 
时 ， 就 需要 更 为 复杂 的 移动 性 管理 协议 了 ， 我 们 将 在 7.5 节 和 7.6 节 中 学 习 这 些 协 议 。 

我 们 现在 看 一 个 同一 子 网 中 的 不 同 BSS 之 间 的 移动 性 的 特定 例子 。 图 7-15 aS 
有 一 台 主 机 Hl 的 两 个 互联 的 BSS， 该 主机 从 BSS1 移动 到 BSS2。 因 为 在 这 个 例子 中 连接 
两 个 BSS 的 互联 设备 不 是 一 台 路 由 器 ， 故 在 两 个 
BSS 中 的 所 有 站 点 (包括 AP) 都 属于 同一 个 IP 
子 网 。 因 此 ， 当 H1 从 BSS1 移动 到 BSS2 it, € 
可 以 保持 自己 的 IP 地址 和 所 有 正在 进行 的 TCP 
连接 。 如 采 互 联 设备 是 一 台 路 由 器， 则 Hl 必须 | 
在 它 移动 进入 的 子 网 中 获得 一 个 新 地 址 。 这 种 地 
址 的 变化 将 打 断 (并且 最 终 终 止 ) 在 Hl 的 任何 


进行 中 的 TCP 连接 。 在 7.6 节 中 ,我们 将 能 看 到 per ae “En 
一 种 网 络 层 移动 性 协议 如 移动 卫 能 被 用 于 避免 | . 
该 问题 。 图 7-15 同一 子 网 中 的 移动 性 





但 是 H1 从 BSS1 移动 到 BSS2 时 具体 会 发 生 哪 些 事 呢 ? 随 着 Hl 逐步 远离 AP1 H1 检 
WAKA APL 的 信号 逐渐 减弱 并 开始 扫描 一 个 更 强 的 信号 。H1 收 到 来 自 AP2 的 信 标 帧 
(在 许多 公司 和 大 学 的 设置 中 它 与 AP] 有 相同 的 SSID), H1 然后 与 AP] 解除 关联 ， 并 与 
AP2 关联 起 来 ， 同 时 保持 其 IP 地 址 和 维持 正在 进行 的 TCP 会 话 。 

从 主机 和 AP 的 角度 ， 这 就 处 理 了 切换 问题 。 但 对 图 7-15 中 的 交换 机 又 会 发 生 什 么 样 
的 情况 呢 ? 交换 机 如 何 知道 主机 已 经 从 一 个 AP 移动 到 另 一 个 AP 呢 ? 回想 第 6 章 所 述 ， 
交换 机 是 “ 目 学 习 ” 的 ， 并 且 自 动 构建 它们 的 转发 表 。 这 种 自学 习 的 特征 很 好 地 处 理 了 偶 
尔 的 移动 (例如 ， 一 个 雇员 从 一 个 部 门 调转 到 另 一 个 部 门 ) 。 然 而 ， 交 换 机 没有 被 设计 用 
来 支持 用 户 在 不 同 BSS 间 高 度 移动 ， 同 时 又 希望 保持 TCP 连接 。 为 理解 这 一 问题 ， 回 想 在 
移动 之 前 ， 交 换 机 在 其 转发 表 中 有 一 个 表 项 ， 对 应 Hl 的 MAC 地 址 与 到 达 H1 所 通过 的 出 
交换 机 端口 。 如 果 H1 初始 在 BSSl 中 ， 则 发 往 Hl 的 数据 报 将 经 AP1 导向 HI 。 然 而 ， 一 
H H1 与 BSS2 关联 ， 它 的 帧 应 当 被 导向 AP2。 一 种 解决 方法 (真有 点 不 规范 ) 是 在 新 的 
关联 形成 后 ， 让 AP2 以 H1 的 源 地 址 加 交换 机 发 送 一 以 太 网 广播 帧 。 当 交换 机 收 到 该 帧 
后 ， 更 新 其 转发 表 ， 使 得 Hl 可 以 通过 AP2 到 达 。802. 11f 标准 小 组 正在 开发 一 个 AP 间 的 
协议 来 处 理 这 些 以 及 相关 的 问题 。 

我 们 以 上 的 讨论 关注 了 在 相同 LAN 子 网 中 的 移动 性 。 前 面 我 们 在 6. 4. 4 节 学 习 过 VLAN， 
它 能 够 用 来 将 若干 LAN 孤岛 连接 成 为 一 个 大 虚拟 LAN， 该 虚拟 LAN 能 够 跨越 很 大 的 地 理 范 
围 。 在 这 种 VALN 中 的 基站 之 间 的 移动 性 能 够 以 上 述 完全 相同 的 方式 来 处 理 [Yu 2011 ] 。 
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7.3.5 802.11 中 的 高 级 特色 


我 们 将 简要 地 讨论 802. 11 网 络 中 具有 的 两 种 高 级 能 力 ， 以 此 来 完成 我 们 学 习 802. 11 
的 内 容 。 如 我 们 所 见 ， 这 些 能 力 并 不 是 完全 特定 于 802. 11 标准 的 ， 而 是 在 该 标准 中 可 能 
由 特定 机 制 产生 的 。 这 使 得 不 同 的 厂商 可 使 用 他 们 自己 (专用 ) 的 方法 来 实现 这 些 能 力 ， 
这 也 许 能 让 他 们 增强 竞争 能 力 。 

1. 802. 11 速率 适应 


我 们 在 前 面 图 7-3 中 看 到 ， 不 同 的 调制 技术 (提供 了 不 同 的 传输 速率 ) 适合 于 不 同 的 
SNR 情况 。 考 虑 这 样 一 个 例子 ， 一 个 802.11 用 户 最 初 离 基站 20 米 远 ， 这 里 信 品 比 高 。 在 
此 高 信 噪 比 的 情况 下 ， 该 用 户 能 够 与 基站 使 用 可 提供 高 传输 速率 的 物理 层 调制 技术 进行 通 
信 ， 同 时 维持 低 BER。 这 个 用 户 多 么 幸福 啊 ! 假定 该 用 户 开 始 移动 ， 回 离开 基站 的 方向 走 
去 ， 随 着 与 基站 距离 的 增加 ，SNR 一 直 在 下 降 。 在 这 种 情况 下 ， 如 果 在 用 户 和 基站 之 间 运 
行 的 802. 11 协议 所 使 用 的 调制 技术 没有 改变 的 话 ， 随 着 SNR 减 小 ，BER 将 高 得 不 可 接 
受 ， 最 终 ， 传 输 的 帧 将 不 能 正确 收 到 。 

由 于 这 个 原因 ， 某 些 802. 11 实现 具有 一 种 速率 自 适 应 能 力 ， 该 能 力 目 适 应 地 根据 当 
前 和 近期 信道 特点 来 选择 下 面 的 物理 层 调制 技术 。 如 果 一 个 节点 连续 发 送 两 个 帧 而 没有 收 
到 确认 (信道 上 一 个 比特 差错 的 隐 式 指示 )， 该 传输 速率 降低 到 前 一 个 较 低 的 速率 。 如 果 
10 个 帧 连续 得 到 确认 ， 或 如 果 用 来 跟踪 自 上 次 降 速 以 来 时 间 的 定时 器 超时 ， 该 传输 速率 
提高 到 上 一 个 较 高 的 速率 。 这 种 速率 适应 机 制 与 TCP 的 拥塞 控制 机 制 具 有 相同 的 “探测 ” 
原理 ， 即 当 条 件 好 时 (反映 为 收 到 ACK) ， 增 加 传输 速率 ， 除 非 某 个 “坏事 ”发 生 了 
(ACK RAKE); 当 某 个 “坏事 ”发 生 了 ， 减 小 传输 速率 。 因 此 ，802. 11 的 速率 适应 和 
TCP 的 拥塞 控制 类 似 于 年 幼 的 孩子 ， 他 们 不 断 地 向 父母 要 求 越 来 越 多 (如 幼儿 要 糖果 ， 青 
少年 要 求 推迟 睡觉 ) ， 直 到 父母 亲 最 后 说 “ 够 了 !”， 孩 子 们 不 再 要 求 了 《〈 仅 当 以 后 情况 已 
经 变 好 了 才 会 再 次 尝试 ) 。 已 经 提出 了 一 些 其 他 方案 以 改善 这 个 基本 的 目 动 速率 调整 方案 
[ Kamerman 1997; Holland 2001; Lacage 2004 | 。 

2. 功率 管理 

功率 是 移动 设备 的 宝贵 资源 ， 因 此 802. 11 标准 提供 了 功率 管理 能 力 ， 以 使 802. 11 节 
点 的 侦 听 、 传 输 和 接收 功能 以 及 其 他 需要 “打开 ”电路 的 时 间 量 最 小 化 。802. 11 功率 管 
理 按 下 列 方式 运行 。 一 个 节点 能 够 明显 地 在 睡眠 和 唤醒 状态 之 间 交 蔡 ( 像 在 课堂 上 睡觉 的 
学 生 !) 。 通 过 将 802. 11 帧 首部 的 功率 管理 比特 设置 为 1， 某 节点 向 接 人 点 指示 它 将 打算 睡 
眠 。 设 置 节 点 中 的 一 个 定时 器 ， 使 得 正好 在 AP 计划 发 送 它 的 信 标 由 前 唤醒 节点 (前 面 讲 
过 AP 通常 每 100ms 发 送 一 个 信 标 帧 ) 。 因 为 AP 从 设置 的 功率 传输 比特 知道 哪个 节点 打算 
睡眠 ， 所 以 该 AP 知道 它 不 应 当 向 这 个 节点 发 送 任何 帧 ， 先 缓存 目的 地 为 睡眠 主机 的 任何 
帧 ， 待 以 后 再 传输 。 

在 AP 发 送信 标 帧 前 ， 恰 好 唤醒 节点 ， 并 迅速 进入 全 面 活 动 状态 (与 睡觉 的 学 生 不 
同 ， 这 种 唤醒 仅 需要 250us[ Kamerman 1997] ) 。 由 AP 发 送 的 信 标 帧 包含 了 帧 被 缓存 在 AP 
中 的 节点 的 列表 。 如 果 某 节点 没有 缓存 的 帧 ， 它 能 够 返回 睡眠 状态 。 否 则 ， 该 节点 能 够 通 
过 向 AP 发 送 一 个 探 询 报 文明 确 地 请 求 发 送 缓存 的 帧 。 对 于 信 标 之 间 的 100ms 时 间 来 说 ， 
250hs 的 唤醒 时 间 以 及 类 似 的 接收 信 标 帧 及 检查 以 确保 不 存在 缓存 帧 的 短小 时 间 ， 没有 帧 
要 发 送 和 接收 的 节点 能 够 睡眠 99% 的 时 间 ， 从 而 大 大 节省 了 能 源 。 
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7.3.6 个 人 域 网 络 : 蓝牙 和 ZigBee 


如 图 7-2 Aras, IEEE 802. 11 WiFi 标准 主要 针对 相距 多 达 100m 的 设备 间 的 通信 (4 
使 用 802. 11 具有 定向 天 线 的 点 对 点 配置 时 除外 ) 。 两 个 其 他 的 正 EE 802 无 线 协 议 是 蓝牙 
和 ZigBee (定义 在 IEEE 802. 15. 1 和 IEEE 802. 15. 4 标准 中 [IEEE 802. 15 2012] ) 。 


1. 蓝牙 


IEEE 802. 15.1 网 络 以 低 功率 和 低 成 本 在 小 范围 内 运行 。 它 本 质 上 是 一 个 低 功 率 、 小 
范围 、 低 速率 的 “电缆 替代 ”技术 ， 用 于 计算 机 与 其 无 线 键 盘 、 鼠 标 或 其 他 外 部 设备 如 蜂 
窝 电 话 、 扬 声 器 、 头 戴 式 耳机 及 其 他 设备 的 互联 ， 而 802.11 是 一 个 较 高 功率 、 中 等 范围 、 
较 高 速率 的 “ 接 人 ”技术 。 为 此 ，802. 15. 1 网 络 有 时 被 称 为 无 线 个 人 域 网 络 〈Wireless 
Personal Area Network, WPAN), 802. 15.1 的 链 路 层 和 物理 层 基于 早期 用 于 个 人 域 网 络 的 
蓝牙 (Bluetooth) 规范 [Held 2001, Bisdikian 2001 ] 。802. 15. 1 网 络 以 TDM 方式 工作 于 
无 须 许可 证 的 2. 4CHz 无 线 电 波段 ， 每 个 时 际 长 度 为 625hs。 在 每 个 时 院内 ， 发 送 方 利用 
79 个 信道 中 的 一 个 进行 传输 ， 同 时 从 时 隙 到 时 隙 以 一 个 已 知 的 伪 随 机 方式 变更 信道 。 这 
种 被 称 作 跳 频 扩展 频谱 ( Frequency-Hopping Spread Spectrum, FHSS) 的 信道 跳动 的 形式 将 
传输 及 时 扩展 到 整个 频谱 。802. 15. 1 能 够 提供 高 达 4Mbps 的 数据 率 。 

802. 15. 1 网 络 是 自 组 织 网 络 : 不 需要 网 络 基础 设施 (如 一 个 接 人 点 ) 来 互 连 
802. 15. 1 设备 。 因 此 ，802. 15. 1 设备 必须 自己 进行 组 织 。802. 15. 1 设备 首先 组 织 成 一 个 
多 达 8 个 活动 设备 的 皮 可 网 (piconet) ， 如 图 7-16 所 示 。 这 些 设备 之 一 被 指定 为 主 设备 ， 
其 余 充当 从 设备 。 主 节点 真正 控制 皮 可 网 ， 即 它 的 时 钟 确 定 了 皮 可 网 中 的 时 间 ， 它 可 以 在 
每 个 奇数 时 际 中 发 送 ， 而 从 设备 仅 当 主 设 z 
备 在 前 一 时 阶 与 其 通信 后 才 可 以 发 送 ， 并 eer Ae. 
且 只 能 发 送 给 主 设备 。 除 了 从 设备 ， 网 络 MO By it ee y 
中 还 可 以 有 多 达 255 个 的 寄 放 ( parked ) 
设备 。 这 些 设 备 仅 当 其 状态 被 主 节点 从 寄 
放 转 换 为 活动 之 后 才 可 以 进行 通信 。 





希望 了 解 更 多 有 关 802. 15. 1WPAN (Re | AOE 
息 的 读者 可 以 查阅 蓝牙 参考 资料 [Hed — Oe ©- O ie 
2001, Bisdikian 2001], ， 或 者 IEEE 802. 15 e ted hs & 从 设备 
官方 Web 网 站 [IEEE 802. 15 2012], @ wins 
2. ZigBee 


图 7-16 蓝牙 皮 可 网 
IEEE 标准 化 的 第 二 个 个 人 域 网 络 是 


802. 14.5 [IEEE 802.15 2012 ] ， 它 被 称 为 ZigBee。 虽 然 蓝 牙 网 络 提供 了 一 种 “电缆 替代 ” 
的 超过 每 秒 兆 比 特 的 数据 率 ， 但 ZigBee 较 之 蓝牙 其 服务 目标 是 低 功 率 、 低 数据 率 、 低 工作 
周期 的 应 用 。 尽 管 我 们 可 能 倾向 于 认为 “更 大 和 更 快 就 更 好 ”， 但 是 并 非 所 有 的 网 络 应 用 
都 需要 高 带宽 和 随 之 而 来 的 高 成 本 (经 济 和 功率 成 本 ) 。 例 如 ， 家 庭 温 度 和 光线 传 感 右 、 
安全 设备 和 墙 上 安装 的 开关 都 是 非常 简单 、 低 功率 、 低 工作 周期 、 低 成 本 设备 。ZigBee Al 
此 是 非常 适合 于 这 些 设 备 的 。ZigBee 定义 了 20kbps、40kbps、100kbps 和 250kbps 的 信道 
速率 ， 这 取决 于 信道 的 频率 。 

ZigBee 网 络 中 的 节点 具有 两 个 特色 。 多 个 所 谓 “ 简 化 功能 设备 ”在 单个 “全 功能 设 
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备 ” 控 制 下 作为 从 设备 运行 ， 与 蓝牙 从 设备 非常 相似 。 一 个 全 功能 设备 能 够 作为 一 个 主 设 
备 运行 ， 就 像 在 蓝牙 中 控制 多 个 从 设备 那样 ， 并 且 多 个 全 功能 设备 还 能 够 配置 为 一 个 网 状 
(mesh) 网 络 ， 其 中 全 功能 设备 在 它们 之 间 发 送 帧 。ZigBee 可 以 共享 许多 我 们 已 经 在 其 他 
链 路 层 协议 中 遇 到 的 协议 机 制 : 信 标 帧 和 链 路 层 确 认 〈 类 似 于 802. 11 ) ， 具 有 二 进 制 回 退 
的 载波 侦 听 随机 访问 协议 〈 类 似 于 802. 11 和 以 太 网 ) ， 以 及 时 隙 的 固定 、 确 保 的 分 配 (类 
似 于 DOCSIS) 。 

ZigBee 网 络 能 够 配置 为 许多 不 同 的 方式 。 我 们 考虑 一 种 简单 的 场合 ， 其 中 单一 的 全 功 
能 设备 使 用 信 标 帧 以 一 种 时 隙 方式 控制 多 个 简化 功能 设备 。 图 7-17 显示 了 这 种 情况 ， 其 
中 ZigBee 网 络 将 时 间 划 分 为 反复 出 现 的 超 帧 ， 每 个 超 帧 以 一 个 信 标 帧 开始 。 每 个 信 标 帧 将 
超 帧 划分 为 一 个 活跃 周期 (在 这 个 周期 内 设备 可 以 传输 ) 和 一 个 非 活 路 周期 (在 这 个 周 
期 内 所 有 设备 包括 控制 器 能 够 睡眠 进而 保存 能 量 )。 活 跃 周期 由 16 个 时 际 组 成 ， 其 中 一 些 
由 采用 CSMA/CA 随机 接 人 方式 的 设备 使 用 ， 其 中 一 些 由 控制 器 分 配给 特定 的 设备 ， 因 而 
为 那些 设备 提供 了 确保 的 信道 。 有 关 ZigBee 网 络 的 更 多 细节 能 够 在 [Baronti 2007, IEEE 
802. 15.4 2012] 中 找到 。 


小 i | | E ‘= 


| | 一 竞争 时 阶 —rle— 确保 的 时 阶 SE 
超 由 


图 7-17 ZigBee 802. 14. 4 超 帧 结构 





7.4 蜂窝 因特网 接 入 


在 前 一 节 中 ， 我 们 考察 了 一 台 因 特 网 主机 当 位 于 WiFi 热 区 中 时 ， 即 当 它 位 于 一 个 
802. 11 接 入 点 附近 时 ， 是 如 何 接 入 因特网 的 。 然 而 大 多 数 Wiki 热 区 只 有 一 个 直径 为 10 ~ 
100m 的 小 规模 覆盖 范围 。 当 我 们 十 分 需要 无 线 因特网 接 入 但 同时 又 无 法 访问 WiFi FAK 
时 ， 该 怎么 办 呢 ? 

鉴于 蜂窝 电话 目前 在 全 球 许多 区 域 已 经 是 无 处 不 在 了 ， 一 个 很 自然 的 策略 就 是 扩展 蜂 
窝 网 络 ， 使 它们 不 仅 支 持 语音 电话 ， 同 时 也 支持 无 线 因 特 网 接 人 。 理 想 情 况 下 ， 这 种 因 特 
网 接 人 将 会 有 相当 高 的 速率 ， 并 且 可 以 提供 无 颖 的 移动 性 ， 人 允许 用 户 在 旅行 过 程 中 〈 如 在 
汽车 或 火车 上 ) 保持 其 TCP 会 话 。 使 用 足够 高 的 上 行 和 下 行 比特 速率 ， 用 户 甚至 可 以 在 
移动 中 维持 视频 会 议 。 这 种 情况 并 非 遥 不 可 及 。 随 着 那些 我 们 将 在 这 里 涉及 的 宽带 数据 服 
务 的 更 广泛 部 署 ， 每 秒 几 兆 比 特 的 数据 速率 正 变 得 可 行 。 

在 本 节 中 ， 我 们 对 当前 和 即将 出 现 的 蜂窝 因特网 接 人 技术 进行 简要 概述 。 我 们 这 里 
仍然 重点 关注 无 线 第 一 跳 以 及 将 无 线 第 一 跳 连 接 进 更 大 的 电话 网 和 因特网 的 网 络 ; 在 
7.7 节 中 ， 我 们 将 考虑 如 何 把 呼叫 路 由 选择 到 在 不 同 基站 间 移 动 的 用 户 。 我 们 的 简要 讨 
论 只 是 对 蜂窝 技术 进行 一 个 简单 、 宏 观 描述 。 当 然 ， 现 代 蜂 窝 通 信 有 更 大 的 广度 和 论 
度 ， 有 许多 大 学 提供 关于 这 一 主题 的 许多 课程 。 和 希望 对 此 做 更 深入 了 解 的 读者 可 参阅 
[ Goodman 1997; Kaaranen 2001; Lin 2001; Korhonen 2003; Schiller 2003; Palat 2009 ; 
Scourias 2012; Turner 2012; Akyildiz 2010], ， 以 及 特别 优秀 和 详尽 的 参考 资料 [ Mouly 
1992; Sauter 2014 | 。 
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4G 蜂窝 移动 与 无 线 LAN 的 比较 


许多 蜂窝 移动 电话 的 运营 者 正在 部 署 4G 蜂 窟 移动 系统 。 在 某 些 国家 (如 韩国 和 日 
A), 4G LTE 履 盖 率 高 于 90% ， 即 几乎 是 无 所 不 在 。 在 2015 年 ， 已 部 署 的 LTE 系统 的 
平均 下 载 速率 ， 范 围 从 美国 和 印度 的 10Mbps 到 新 西 兰 的 接近 40Mbps。 这 些 4G 系统 部 
署 在 需要 许可 证 的 无 线 频带 中 ， 运 营 者 向 政府 支付 可 观 的 费用 来 获得 使 用 频谱 的 许可 
证 。4G 系统 以 一 种 与 现在 仅 蜂 窟 电话 接 入 的 相似 方式 ， 允 许 用 户 在 移动 中 从 适 远 的 户 
外 位 置 接 入 因特网 。 在 许多 场合 中 ， 用 户 可 以 同时 接 入 无 线 LAN 和 4G。 对 于 4G 系统 
| 具有 的 更 为 受 限 和 更 为 昂贵 的 能 力 ， 许 多 移动 设备 在 两 者 都 可 用 时 ， 默 认 使 用 WiFi 而 
不 是 使 用 4G。 无 线 边缘 网 络 接 入 将 主要 经 过 无 线 LAN 还 是 经 过 蜂窝 系统 仍 是 一 个 悬 而 
未 决 的 问题 : 

o 新 兴 的 无 线 LAN 基础 设施 将 可 能 变 得 几乎 无 所 不 在 。 工 作 于 S4Mbps 和 更 高 速 
率 的 IEEE 802.11 无 线 LAN 已 经 得 到 了 广泛 部 署 。 几 乎 所 有 便携 计算 机 、 平 板 
电脑 和 智能 手机 出 厂 时 都 配 有 802.11 LAN 的 能 力 。 而 且 ， 新 兴 的 因特网 装置 
(例如 无 线 照 相机 和 相框 ) 也 具有 低 功 率 的 无 线 LAN 能 力 。 

© 无 线 LAN 的 基站 也 能 处 理 移动 电话 装置 。 许 多 电话 已 经 能 够 直接 或 使 用 类 
Skype IP 语音 服务 与 蜂窝 电话 网 络 或 IP 网 络 连接 ， 因 此 绕 过 运营 者 的 蜂窝 语音 
fo 4G 数据 服务 。 

当然 ， 许 多 其 他 的 专家 相信 4G 不 仅 将 取得 巨大 的 成 功 ， 而 且 也 将 使 我 们 工作 和 生 
| 活 的 方式 发 生 引 人 注目 的 革命 。WiFi 和 4G 很 可 能 都 会 成 为 流行 的 无 线 技术 ， 让 漫游 无 
| 线 设备 自动 选择 在 其 当前 所 处 物理 位 置 提供 最 好 服务 的 接 入 技术 。 








7.4.1 蜂窝 网 体系 结构 概述 


在 本 节 描 述 蜂窝 网 体系 结构 时 ， 我 们 将 采用 全 球 移 动 通信 系统 (CSM) 标准 的 术语 。 
从 历史 的 角度 看 ， 首 字母 缩写 词 CSM 源 于 术语 “Groupe Spécial Mobile”， 后 来 才 采 用 了 更 
为 英文 化 的 名 字 ， 使 最 初 的 首 字母 缩写 词 得 以 保留 。 到 了 20 世纪 80 年 代 ， 欧 洲 人 认识 到 
需要 一 个 泛 欧 洲 的 数字 蜂 窒 电话 系统 ， 以 代替 多 个 不 兼容 的 模拟 蜂窝 电话 系统 ， 从 而 导致 
了 GSM 标准 的 出 现 [Mouly 1992 ] 。 欧 洲 人 在 20 世纪 90 年 代 初 就 成 功 地 部 署 了 GSM 技 
术 ， 自 此 后 GSM 成 长 为 移动 电话 领域 的 庞然大物 ， 全 世界 有 超过 80% 的 蜂窝 用 户 使 
用 GSM, 

当 人 们 谈论 蜂窝 技术 时 ， 经 常 将 该 技术 分 类 为 几 “ 代 ”之 一 。 最 早 一 代 的 设计 主要 用 
于 语音 通信 。 第 一 代 (1G) 系统 是 模拟 FDMA 系统 ， 其 专门 用 于 语音 通信 。 这 些 1G 系统 
目前 几乎 绝迹 ， 它 们 被 数字 2G 系统 所 替代 。 初 始 的 2G 系统 也 是 为 语音 而 设计 ,但 后 来 
除了 语音 服务 外 还 扩展 了 对 数据 ( 即 因特网 ) 的 支持 (2.5G)。3G 系统 也 支持 语音 和 数 
据 ， 但 更 为 强调 数据 能 力 和 更 高 速 的 无 线 电 接 入 链 路 。 今 天 正在 部 署 的 4G 系统 基于 LTE 
技术 ， 其 特征 为 全 IP 核心 网 络 ， 并 且 以 几 兆 比特 速率 提供 了 话音 和 数据 集成 。 

2G 蜂窝 网 体系 结构 : 语音 与 电话 网 连接 

术语 蜂窝 (cellular) 是 指 这 样 的 事实 ， 即 由 一 个 蜂窝 网 覆盖 的 区 域 被 分 成 许多 称 作 小 
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区 (cell) 的 地 理 覆 盖 区 域 ， 小 区 如 图 7-18 左 侧 的 六 边 形 所 示 。 如 同 在 7. 3. 1 节 中 学 习 的 
802. 11WiFi 标准 一 样 ，GSM 有 自己 的 特殊 命名 法 。 每 个 小 区 包含 一 个 收发 基站 (Base 
Transceiver Station ，BTS) ， 负 责 回 位 于 其 小 区 内 的 移动 站 点 发 送 或 接收 信号 。 一 个 小 区 的 
覆盖 区 域 取决 于 许多 因素 ， 包 括 BTS 的 发 射 功率 、 用 户 设备 的 传输 功率 、 小 区 中 的 障碍 建 
筑 物 以 及 基站 天 线 的 高 度 。 尽 管 图 7-18 中 显示 的 是 每 个 小 区 包含 一 个 位 于 该 小 区 中 间 的 
收发 基站 ， 但 今天 的 许多 系统 将 BTS 放置 在 3 个 小 区 的 交叉 处 ， 使 得 具有 有 回 天 线 的 单个 
BTS 能 够 为 三 个 小 区 提供 服务 。 






aa 收发 基站 (BTS) 
SS 基站 控制 器 (BSC) 
P © BAM (MSC) 
“a 基站 系统 (BSS) otal 移动 用 户 

图 7-18 GSM 2G 蜂窝 网 体系 结构 的 组 件 


2G 蜂窝 系统 的 CSM 标准 对 空中 接口 使 用 了 组 合 的 FDM/TDM (无 线 电 )。 第 1 章 中 讲 
过 ， 使 用 纯 FDM， 信 道 被 划分 成 许多 频段 ， 每 个 呼叫 分 配 一 个 频段 。 第 1 章 也 讲 过 ， 使 用 纯 
TDM， 时 间 被 划分 为 帧 ， 每 个 帧 又 被 进一步 划分 为 时 队 ， 每 个 呼叫 在 循环 的 帧 中 被 分 配 使 用 
特定 的 时 隙 。 在 组 合 的 FDMZTDM 系统 中 ， 信 道 被 划分 为 耕 干 频率 子 带 ; 对 于 每 个 子 带 ， 时 
间 又 被 划分 为 帧 和 时 际 。 因 此 ， 对 于 一 个 组 合 的 FDMATDM 系统 ， 如 果 信 道 被 划分 为 下 个 子 
带 ， 并 且 时 间 被 划分 为 7 了 个 时 际 ， 那 么 该 信道 将 能 够 支持 "7T 个 并 发 的 呼叫 。 我 们 在 6. 3. 4 
节 中 看 到 ， 电 缆 接 入 网 也 使 用 了 组 合 的 FDM/ATDM 方法 。GSM 系统 由 多 个 200kHz 的 频带 组 
成 ， 每 个 频带 支持 8 个 TDM 呼叫 。GSM 以 13kbps 和 12. 2kbps 的 速率 编码 。 

一 个 GSM 网 络 的 基站 控制 器 Base Station Controller, BSC) 通常 服务 于 几 十 个 收发 
基站 。BSC 的 责任 是 为 移动 用 户 分 配 BTS ARAE, PTA (paging) ( 找 出 某 移动 用 
户 所 在 的 小 区 ) ， 执 行 移动 用 户 的 切换 (切换 是 我 们 将 在 7.7.2 节 中 涉及 的 主题 ) 。 基 站 控 
制 器 及 其 控制 的 收发 基站 共同 构成 了 GSM 基站 系统 (Base Station System, BSS), 

我 们 将 在 7.7 节 中 看 到 ， 在 用 户 鉴 别 和 账户 管理 (决定 是 否 允 许 某 个 移动 设备 与 蜂 窜 
网 络 连接 ) 以 及 呼叫 建立 和 切换 中 ， 移 动 交换 中 心 (Mobile sWitching Center, MSC) 起 着 
决定 性 的 作用 。 单 个 MSC 通常 将 包含 多 达 5 个 BSC， 因 此 每 个 MSC 有 大 约 200 000 个 用 
户 。 一 个 蜂 窜 提供 商 的 网 络 将 有 若干 MSC， 使 用 称 为 网 关 MSC 的 特殊 MSC 将 提供 商 的 蜂 
窝 网 络 与 更 大 的 公共 电话 网 相连 。 


7.4.2 3G 蜂窝 数据 网 : 将 因特网 扩展 到 蜂窝 用 户 
我 们 在 7. 4. 1 节 中 的 讨论 关注 了 蜂 窗 语音 用 户 连 接 到 公共 电话 网 。 但 当 我 们 开始 这 样 


ERAK ERAN 361 


干 时 ， 当 然 也 乐意 读 电 子 邮 件 、 访 问 Web 、 获 取 位 置 相关 的 服务 (例如 地 图 和 和 餐馆 推荐 ) ， 
或 许 甚 至 观看 流 式 视频 。 为 此 ， 我 们 的 智能 手机 需要 运行 完整 的 TCP/IP 协议 栈 (包括 物 
理 层 、 链 路 层 、 网 络 层 、 运 输 层 和 应 用 层 )， 并 能 够 经 过 蜂窝 数据 网 连接 进入 因特网 。 随 
着 一 代 (AER) 继承 一 代 ， 以 及 引入 许多 具有 新 首 字 和 母 缩 略 词 的 新 技术 和 服务 ， 蜂 帘 数 
据 网 的 主题 是 一 个 相当 令 人 眼花 综 乱 的 竞争 和 不 断 演化 的 标准 集合 ， 这 个 标准 集合 相当 令 
人 迷惑 。 更 糟糕 的 是 ， 没 有 单一 的 官方 机 构 对 2.5G、3G、3.5G 或 4G 技术 提出 要 求 ， 难 
以 理 清 这 些 竞 争 性 标准 之 间 的 差异 。 在 我 们 下 面 的 讨论 中 ， 我们 将 关注 由 第 三 代 合 作 伙 伴 
项 目 (3rd Generation Partnership Project, 3GPP) 研发 的 通用 移动 通信 服务 (Universal Mo- 
bile Telecommunications Service, UMTS) 3G 和 4G 标准 [3GPP 2016 |。 
我 们 自 上 而 下 地 查看 一 下 显示 在 图 7-19 中 的 3G 蜂窝 数据 网 体系 结构 。 


公共 电话 网 







。 ZREO 
(WCDMA, HSPA) 


— 无 线 电 接 入 网 一 >p 


核心 网 因特网 
通用 陆地 无 线 接 入 网 通用 分 组 无 线 服 务 
(UTRAN) (GPRS) 核心 网 





服务 GPRS 支 持 ”网 关 GPRS 支 持 
节点 (SGSN) ”节点 (GGSN) 


图 7-19 3G 系统 体系 结构 


1. 3G 核心 网 

3G 核心 蜂窝 数据 网 将 无 线 电 接 入 网 连接 到 公共 因特网 。 核 心 网 与 我 们 前 面 在 图 7-18 中 
遇 到 过 的 现 有 蜂窝 语音 网 (特别 是 MSC) 的 组 件 协作 。 由 于 在 现 有 的 蜂窝 语音 网 中 具有 大 量 
的 现 有 基础 设施 〈 有 利 可 图 的 服务 !) ，3G 数据 服务 的 设计 者 们 所 采取 的 方法 非常 清楚 : 不 
去 触动 现 有 核心 GSM 蜂 帘 语音 网 ， 增 加 与 现 有 蜂 帘 语音 网 平行 的 附加 蜂 帘 数据 功能 。 如 果 
将 新 的 数据 服务 直接 增加 到 现 有 的 蜂窝 语音 网 上 ， 这 种 方法 同样 会 引发 4. 3 节 中 遇 到 过 的 挑 
战 一 一 在 前 面 我 们 讨论 了 在 因特网 中 新 的 (IPv6) 和 旧 的 (IPv4) 集成 的 技术 。 
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在 3G 核心 网 中 有 两 类 节点 : 服务 通用 分 组 无 线 服 务 支持 节点 (Serving Generalized 
packet radio service Support Node, SGSN) 和 网 关 GPRS 支持 节点 (Gateway GPRS Support 
Node, GGSN), (GPRS (General Packet Radio Service) 表示 通用 分 组 无 线 服 务 ， 这 是 一 种 
在 2G 网 络 中 的 早期 蜂窝 数据 服务 ; 这 里 我 们 讨论 的 是 在 3G 网 络 中 GPRS 的 演化 版 本 。) 
一 个 SGSN 负责 向 位 于 其 连接 的 无 线 电 接 入 网 中 的 移动 节点 交付 (或 从 移动 节点 获取 ) 数 
据 报 。SGSN 与 该 区 域 蜂窝 语音 网 的 MSC 进行 交互 ， 提 供用 户 认 证 和 切换 ， 维 护 活跃 移动 
节点 的 位 置 (小 区 ) 信息 ， 执 行 位 于 无 线 接 人 网 中 的 移动 节点 和 GGSN 之 间 的 数据 报 转 
发 。GGSN 起 着 网 关 的 作用 ， 将 多 个 SGSN 连接 到 更 大 的 因特网 。GGSN 因此 是 源 于 移动 节 
点 的 一 个 数据 报 在 进入 更 大 因特网 之 前 遇 到 的 3G 基础 设施 的 最 后 一 部 分 。 对 外 部 而 言 ， 
GGSN 看 起 来 像 任何 其 他 网 络 路 由 器 ， 从 外 面 看 来 ，GGSN 网 络 中 36 节点 的 移动 性 隐藏 在 
GGSN 背后 。 

2. 3G 无 线 电 接 人 网 : 无 线 边 缘 

3G 无 线 电 接 入 网 (radio access network) 是 我 们 作为 3G 用 户 看 见 的 无 线 第 一 跳 网 络 。 
无 线 电网 络 控制 器 (Radio Network Controller, RNC) 通 第 控制 几 个 小 区 的 收发 基站 ， 类 似 
于 我 们 在 2G 网 络 中 遇 到 的 基站 (但 是 3G UMTS 的 正式 用 语 称 为 一 个 “节点 B”， 这 是 一 
个 相当 不 具 描 述 性 名 字 !) 。 每 个 小 区 的 无 线 链 路 运行 在 移动 节点 和 收发 基站 之 间 ， 就 像 在 
2G 网 络 中 那样 。RNC 既 通过 MSC 与 电路 交换 蜂窝 语音 网 连接 ， 又 通过 SGSN 与 分 组 交换 
的 因特网 连接 。 因 此 ， 尽 管 3G 蜂窝 语音 服务 和 蜂窝 数据 服务 使 用 不 同 的 核心 网 ， 但 它们 
共享 一 个 相同 的 第 一 /最 后 一 跳 无 线 电 接 入 网 。 

较 之 2G 网 络 ， 在 3G UMTS 中 的 一 个 重大 变化 是 不 再 使 用 GSM 的 FDMA/TDMA 方案 ， 
UMTS 在 TDMA 时 际 中 使 用 称 为 直接 序列 宽带 CDMA (Direct Sequence Wideband CDMA, 
DS-WCDMA) 的 CDMA 技术 [Dahlman 1998], TDMA 时 隙 又 在 多 个 频率 上 可 供 使 用 ， 即 
有 趣 地 使 用 了 我 们 在 前 面 第 6 章 指出 的 全 部 三 种 不 同 的 信道 共享 方法 ， 并 且 类 似 于 有 线 电 
缆 接 人 网 中 所 采用 的 方法 (参见 6.3.4 节 )。 这 种 变化 要 求 一 个 新 的 3G 蜂窝 无 线 接 人 网 与 
显示 在 图 7-19 中 的 2G BSS 无 线 电网 络 并 行 运行 。 与 WCDMA 规范 相关 的 数据 服务 被 称 为 
高 速 分 组 接 入 (High Speed Packet Access，HSPA ) ， 其 下 行 数 据 传 输 率 有 望 高 达 14Mbps. 
AK 3G 网 络 的 细节 能 够 在 3CPP Web 站 点 上 找到 [3CPP 2016]. 


7.4.3 走向 4G: LTE 


第 四 代 (4G) 蜂窝 系统 正在 广泛 部 署 中 。 在 2015 年 ， 有 50 多 个 国家 的 4G BK 
过 50%。 由 3GPP 提出 的 4G 长 期 演进 互联 网 (LTE) 标准 [Sauter 2014], RZ 3G 系统 
而 言 有 两 个 重要 的 创新 : 一 个 全 IP 核心 网 和 一 个 加 强 的 无 线 电 接 入 网 。 下 面 对 此 进行 
讨论 。 
1. 4G 系统 体系 结构 : 一 个 全 IP 核心 网 
图 7-20 显示 了 总 体 的 4G 网 络 体系 结构 ， 它 〈 不 位 地 ) 又 引入 另 一 个 〈 相 当 难 以 理 
解 的 ) 新 词汇 以 及 一 些 网 络 组 件 的 首 字母 缩写 词 。 但 我 们 不 要 被 这 些 首 字 母 缩 写 词 搞 尝 ! 
有 关 4G 体系 结构 ， 有 两 个 重要 的 高 层次 观察 。 
e 一 种 统一 的 、 全 IP 网 络 体 系 结构 。 与 图 7-19 显示 的 3G 网 络 不 同 ，3G 网 络 对 于 语 
音 和 数据 流量 具有 分 离 的 网 络 组 件 和 路 径 ， 显示 在 图 7-20 中 的 4G 体系 结构 是 
“全 四 的”"， 即 语音 和 数据 都 承载 在 IP ARRP, KA ZERRE (HPE 
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#, 4G 的 术语 为 UE)， 到 分 组 网 关 (P-GW) 一 一 该 P-GW 将 4G 边缘 网 络 连 接 到 
网 络 的 其 他 部 分 。 使 用 了 4G， 蜂 窝 网 络 来 源 于 电话 的 最 后 痕迹 已 经 荡然 无 存 ， 让 
位 给 统一 的 IP 服务 了 ! 





E-UTRAN 
无 线 电 接 入 网 全 IP 加 强 分 组 核 (EPC) 


图 7-20 4G 网 络 体系 结构 


© 4G 数据 平面 与 4G 控制 平面 的 清晰 分 离 。 分 别 对 照 第 4 章 和 第 5 Erp IP 网 络 层 的 


数据 平面 与 控制 平面 之 间 的 特征 ，4G 网 络 体 系 结构 也 清晰 地 分 离 了 数据 平面 和 控 
制 平面 。 我 们 将 在 下 面 讨 论 它 们 的 功能 。 
无 线 电 接 入 网 与 全 IP 核心 网 之 间 的 清晰 分 离 。 承 载 用 户 数据 的 IP 数据 报 经 过 通 往 
外 部 因特网 的 内 部 4G IP 网 络 ， 在 用 户 (UE) 和 网 关 (图 7-20 中 的 P-GW) 之 间 
转发 。 在 4G 控制 服务 组 件 之 间 经 过 相同 的 内 部 网 络 交 换 控 制 分 组 ， 这 些 组 件 的 作 
用 将 在 下 面 描述 。 

4G 体系 结构 的 主要 组 件 如 下 : 
eNodeB 是 2G 基站 和 3G 无 线 电网 络 控制 器 〈 又 称 为 节点 B) 的 逻辑 后 代 ， 并 且 
此 时 还 起 着 关键 作用 。 它 的 数据 平面 作用 是 在 UE 和 P-GW 之 间 (经 过 LTE 无线 
电 接 入 网 ) 转发 数据 报 。UE 数据 报 在 eNodeB 被 封装 ， 并 且 通 过 4G 网 络 的 全 P 
强化 分 组 核 (EPC) 以 隧道 形式 传输 到 P-GW。eNodeB 与 P-GW 之 间 的 隧道 类 似 
于 我 们 在 4.3 节 中 看 到 的 IPv6 数据 报 隧道 ， 这 些 分 组 在 两 个 IPv6 端点 之 间 通 过 一 
个 使 用 IPv4 路 由 器 的 网 络 传输 。 这 些 隧 道 可 能 与 保证 服务 质量 (QoS) 相关 。 例 
i, 4G 网 络 可 能 确保 语音 流量 在 UE 和 P-GW 之 间 历 经 不 超过 100ms 时 延 ， 分 组 
丢失 率 小 于 1% ; TCP 流量 也 许 能 够 确保 300ms 时 延 以 及 小 于 0. 0001% 的 分 组 丢 
RÆ [Palat 2009 ] 。 我 们 将 在 第 9 章 涉及 QoS。 在 控制 平面 中 ，eNodeB 代表 UE 来 
处 理 注 册 和 移动 性 信 令 流量 。 
分 组 数据 网 络 网 关 (Packet Data Network Gateway, P-GW) 给 UE 分 配 卫 地 址 ， 并 
HRUE QoS 实施 。 作 为 隧道 端点 ， 当 回 或 从 UE 转发 数据 报时 ， 它 也 执行 数据 报 
封装 / 解 封装 。 
服务 网 关 (S-GW) 是 数据 平面 移动 性 锚 点 ， 即 所 有 UE 流量 将 通过 S-GW 传递 。 
该 S-GW 也 执行 收费 / 记 账 功能 以 及 法 定 的 流量 拦截 。 
移动 性 管理 实体 (Mobility Management Entity, MME) 代表 位 于 它 所 控制 单元 中 的 
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UE ， 执 行 连接 和 移动 性 管理 。 它 从 HHS 接收 UE 订购 信息 。 我 们 在 7.7 节 中 详细 
讨论 蜂窝 网 络 中 的 移动 性 。 
。 归属 用 户 服务 (Home Subscriber Server, HSS) 包含 了 包括 漫游 接 入 能 力 、 服 务 质 
量 配置 文件 和 鉴别 信息 的 UE 信息 。 如 我 们 在 7.7 PAL, 该 HSS 从 UE 归属 蜂 
窝 提供 商 得 到 这 些 信息 。 
[ Motorola 2007 ; Palat 2009; Sauter 2014] 对 4G 网 络 体系 结构 及 其 EPC 做 了 可 读 性 很 
强 的 介绍 。 
2. LTE 无 线 电 接 人 网 
LTE 在 下 行 信道 采用 频 分 复 用 和 时 分 复 用 结合 的 方法 ， 称 之 为 正 交 频 分 复 用 ( Orthog- 
onal Frequency Division Multiplexing, OFDM) 技术 [Rohde 2008; Ericsson 2011], (“IE%é” 
一 词 来 源 于 如 下 事实 ， 所 生成 的 在 不 同 频道 上 发 送 的 信号 ， 它 们 相互 干扰 非常 小 ， 即 使 当 信 
道 频率 紧密 排列 时 )。 在 LTE 中 ， 每 个 活 
跃 的 移动 节点 都 可 以 在 一 个 或 更 多 个 信 
道 频率 上 被 分 配 一 个 或 更 多 个 0. 5ms 时 
Be, FA7-21 显示 了 在 4 个 频率 上 分 配 8 
个 时 际 的 情况 。 通 过 分 配 越 来 越 多 的 时 
Be (无 论 是 用 相同 的 频率 还 是 用 不 同 的 
频率 ) ， 移 动 节点 能 够 获取 越 来 越 高 的 传 
输 速 率 。 在 移动 节点 之 间 进 行 时 除 〈 重 ) 
分 配 的 频 度 为 每 毫秒 一 次 。 不 同 的 调制 
方案 也 能 用 于 改变 传输 速率 ， 参 见 我 们 
前 面 对 图 g ee 的 讨论 以 及 WiFi 网 络 中 调 0 0.5 1.0 1.5 20 23 90 9.5 10.0 
制 方案 的 动态 选择 。 图 7-21 在 每 个 频率 上 ，20 40. Sms 的 时 隙 组 成 
LTE 标准 并 未 对 向 移动 节点 特殊 分 10ms 帧 。 阴 影 显 示 了 一 个 8 时 院 分 配 
配 时 际 进 行 强制 要 求 。 相 反 ， 人 允许 哪个 移动 节点 在 某 个 给 定 的 时 际 在 给 定 的 频率 下 传输 ， 
这 个 决定 由 LTE 设备 商 和 /或 网 络 运营 商 提 供 的 调度 算法 来 做 出 。 使 用 机 会 调度 | Bender 
2000; Kolding 2003; Kulkarni 2005 ] ， 将 物理 层 协 议 与 发 送 方 和 接收 方 之 间 的 信道 条 件 相 
匹配 ， 基 于 信道 条 件 选 择 分 组 将 发 往 的 接收 方 ， 使 无 线 电 网 络 控制 器 能 够 最 大 限度 地 利用 
无 线 媒 体 。 此 外 ， 能 够 使 用 用 户 优先 权 和 服务 的 契约 等 级 〈 如 银 、 金 或 铂金 ) 调度 下 行 分 
组 传输 。 除 了 上 面 描述 的 LTE 能力， 高 级 LTE 通过 向 移动 节点 分 配 聚合 信道 提供 了 数 百 
兆 下 行 带宽 [Akyildiz 2010} 。 
另 一 种 4G 无 线 技术 是 WiMAX (全 球 微波 接 入 互 操作 ) ， 它 是 一 个 IEEE 802. 16 标准 
HN, 5 LTE 有 着 重大 差异 。WiMAX 目前 还 没有 得 到 LTE 那样 的 广泛 部 署 ， 它 的 详细 
讨论 能 够 在 本 书 的 Web 站 点 上 找到 。 


7.5 移动 管理 : 原理 


学 习 了 无 线 网 络 中 通信 和 链 路 的 无 线 特性 后 ， 现 在 我 们 将 注意 力 转向 这 些 无 线 链 路 带 来 
的 移动 性 。 宽 泛 地 讲 ， 移 动 节点 是 随时 间 改 变 它 与 网 络 连接 位 置 的 节点 。 因 为 移动 性 这 一 
术语 在 计算 机 界 和 电话 界 有 许多 含义 ， 所 以 先 更 为 详细 地 讨论 一 下 移动 性 的 各 个 方面 将 对 
我 们 很 有 帮助 。 
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e 从 网 络 层 的 角度 看 ， 用 户 如 何 移动 ? 一 个 物理 上 移动 的 用 户 将 对 网 络 层 提 出 一 系 
列 不 同 寻 常 的 挑战 ， 这 取决 于 他 〈 她 ) 在 网 络 连接 点 之 间 如 何 移动 。 在 图 7-22 中 
的 移动 程度 谱 的 一 端 ， 用 户 也 许 带 着 一 台 装 有 无 线 网 络 接口 卡 的 便携 机 在 一 座 建 
筑 物 内 走动 。 如 我 们 在 7.3.4 节 中 所 见 ， 从 网 络 层 的 角度 来 看 ， 该 用 户 并 没有 移 
动 。 而 且 ， 如 果 该 用 户 不 论 在 何 处 都 与 同一 个 接 人 点 相关 联 ， 从 链 路 层 角度 来 看 
该 用 户 甚至 也 没有 移动 。 

在 该 移动 程度 谱 的 另 一 端 ， 考 虑 一 下 该 用 户 在 一 辆 宝马 或 特 斯 拉 轿 车 内 以 
150km/h 的 时 速 沿 高 速 公 路 急速 行驶 时 穿 过 多 个 无 线 接 人 网 ， 并 希望 在 整个 旅程 
中 保持 一 个 与 远程 应 用 的 不 间断 的 TCP 连接 。 这 个 用 户 无 疑 是 移动 的 ! 在 这 两 种 
极端 之 间 的 情况 是 ， 一 个 用 户 带 着 一 台 便 携 机 从 一 个 地 方 ( 如 办 公 室 或 宿舍 ) 到 
另 一 个 地 方 〈 如 咖啡 店 、 教 室 ) ， 并 且 想 在 新 地 方 连 人 网 络 。 该 用 户 也 是 移动 的 
(虽然 比 “ 宝 马 ” 驾 驶 员 的 移动 性 差 一 些 !) ， 只 不 过 不 需要 在 网 络 接 人 点 之 间 移 
动 时 维持 一 个 不 间断 的 连接 。 图 7-22 从 网 络 层 角度 阐明 了 用 户 移 动 性 的 程度 谱 。 
无 移动 性 高 移动 性 
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用 户 仅 在 相同 用 户 在 接 入 网 之 间 用 户 在 接 入 网 之 
的 无 线 接 入 网 中 移动 ， 当 在 网 间 移动 间 移 动 ， 同 时 维持 
移动 时 关闭 连接 进行 中 的 连接 


图 7-22 ”从 网 络 层 观点 来 看 各 种 程度 的 移动 性 


© 移动 节点 的 地 址 始终 保持 不 变 有 多 么 重要 ? 对 移动 电话 而 言 ， 当 你 从 一 个 提供 商 
移动 电话 网 络 到 另 一 个 的 过 程 中 ， 你 的 电话 号 码 (本 质 上 是 你 电话 的 网 络 层 地 址 ) 
始终 保持 不 变 。 类 似 地 ， 便 携 机 在 IP 网 络 之 间 移 动 时 是 否 也 必须 维持 相同 的 人 地 
址 呢 ? 

对 这 一 问题 的 回答 很 大 程度 上 取决 于 所 运行 的 应 用 程序 。 对 于 那个 在 高 速 公 
路 上 飞驰 ， 同 时 又 希望 维持 对 一 个 远程 应 用 的 不 间断 的 TCP 连接 的 宝马 或 特 斯 拉 
司机 而 言 ， 维 持 相 同 的 IP 地 址 将 会 带 来 便利 。 回 想 第 3 章 ， 一 个 因特网 应 用 程序 
需要 知道 它 与 之 通信 的 远 端 实体 的 全 地 址 和 端口 号 。 如 果 一 个 移动 实体 在 移动 过 
程 中 能 够 保持 其 卫 地 址 不 变 ， 从 应 用 的 角度 ， 移 动 性 就 变 得 不 可 见 。 这 种 透明 性 
有 十 分 重要 的 价值 ， 即 应 用 程序 不 必 关 心 P 地 址 潜在 的 变化 ， 并 且 同 样 的 应 用 程 
序 代码 既 可 用 于 移动 连接 ， 又 可 用 于 非 移 动 连接 。 在 下 一 节 我 们 将 会 看 到 移动 IP 
提供 了 这 种 透明 性 ， 它 允许 移动 节点 在 网 络 间 移动 的 同时 维持 其 永久 的 IP 地址。 

在 另 一 方面 ， 一 个 不 太 喜 欢 新 潮 的 移动 用 户 也 许 只 想 关 闭 办 公 室 便携 机 ， 将 
其 带 回 家 ， 然 后 开机 ， 再 在 家 中 工作 。 如 果 该 便携 机 在 家 时 只 是 作为 一 个 客户 ， 
使 用 客户 - 服务 器 方式 的 应 用 (如 发 送 /阅读 电子 邮件 、 浏 览 Web 、 通 过 Telnet 与 
远程 主机 相连 ) ， 则 使 用 特定 IP 地 址 并 不 是 那么 重要 。 特 别 是 ， 用 户 能 够 得 到 一 
个 由 服务 于 家 庭 的 ISP 临时 分 配 的 IP 地 址 即 可 。 我 们 在 4. 3 节 中 看 到 的 DHCP 提 
供 了 这 种 功能 。 

© 支持 有 线 基础 设施 的 东西 有 哪些 可 用 ? 在 所 有 上 述 情形 中 ， 我 们 都 隐 含 地 假设 
存在 一 个 固定 的 基础 设施 让 移动 用 户 连 接 ， 例 如 家 庭 的 ISP 网 络 、 办 公 室 的 无 
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线 接 入 网 ， 或 者 沿 高 速 公 路 的 无 线 接 和 人 网。 如果 这 样 的 基础 设施 不 存在 会 怎么 
FE? 如果 两 个 用 户 位 于 彼此 的 通信 范围 内 ， 他 们 能 和 否 在 没有 其 他 网 络 基础 设施 
存在 的 情况 下 建立 一 个 网 络 连 接 ? 自 组 织 网 络 正 好 提供 了 这 些 能 力 。 这 一 飞速 
发 展 的 领域 位 于 移动 网 络 研究 的 前 沿 ， 超 出 了 本 书 的 范围 。 [ Perkins 2000] 和 
IETF 移动 自 组 织 网 络 (manet) 工作 组 主页 [manet 2016] 提供 了 有 关 这 一 主题 
的 详尽 讨论 。 

为 了 阐述 允许 移动 用 户 在 不 同 网 络 间 移动 过 程 中 维持 正在 进行 的 连接 所 涉及 的 问 
题 ， 我 们 考虑 一 个 人 类 的 类 比例 子 。 一 位 20 岁 左 右 的 青年 从 家 里 搬出 ， 成 为 流动 的 人 ， 
在 一 些 宿舍 或 公 寅 居住 ， 并 经 常 改换 住址 。 如 果 一 个 老 朋 友 想 与 他 联系 ， 这 位 朋友 怎样 
才能 找到 这 个 流动 的 朋友 呢 ? 一 种 常用 的 方法 是 与 他 的 家 庭 取 得 联系 ， 因 为 一 位 流动 的 
青年 通常 会 将 其 目前 的 地 址 告诉 家 里 ( 即使 没有 其 他 原因 ， 哪 怕 只 是 为 了 让 父母 寄 钱 来 
帮 他 付 房 租 ) 。 其 家 庭 由 于 有 一 个 永久 地 址 ， 因 此 成 为 其 他 想 与 该 流动 青年 联系 的 人 可 
采用 的 第 一 步 。 这 些 朋 友 后 来 与 他 的 通信 也 许 是 间接 的 (如 先 将 邮件 发 送 到 其 父母 家 ， 
再 转发 给 该 流动 的 青年 ) ， 也 许 是 直接 的 (如 该 朋友 用 得 到 的 地 址 直接 将 邮件 发 送 给 其 
流动 的 朋友 )。 

在 一 个 网 络 环境 中 ， 一 个 移动 节点 (如 一 台 便 携 机 或 智能 手机 ) 的 永久 居所 被 称 为 归 
属 网 络 (home network ) ， 在 归属 网 络 中 代表 移动 节点 执行 下 面 讨 论 的 移动 管理 功能 的 实体 
叫 归属 代理 (home agent) 。 移 动 节点 当前 所 在 网 络 叫 作 外 部 网 络 (foreign network) 或 被 
访 网 络 (visited network) ， 在 外 部 网 络 中 帮助 移动 节点 做 移动 管理 功能 的 实体 称 为 外 部 代 
理 (foreign agent) 。 对 于 移动 的 专业 人 员 而 言 ， 他 们 的 归属 网 络 可 能 就 是 其 公司 网 络 ， 而 
被 访 网 络 也 许 就 是 他 们 正 访问 的 某 同 行 所 在 的 网 络 。 一 个 通信 者 (correspondent) 就 是 布 
望 与 该 移动 节点 通信 的 实体 。 图 7-23 阐述 了 这 些 概念 ， 也 说 明了 下 面 考虑 的 编 址 概念 。 
在 图 7-23 中 ， 我 们 注意 到 代理 被 配置 在 路 由 器 上 (例如 ， 作 为 在 路 由 器 上 运行 的 进程 )， 
但 它们 也 能 在 网 络 中 其 他 主机 或 服务 器 上 执行 。 
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图 7-23 移动 网 络 体系 结构 中 的 初始 要 素 
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7.5.1 寻 址 


我 们 前 面 提 到 为 了 使 用 户 移 动 性 对 网 络 应 用 透明 ， 和 希望 一 个 移动 节点 在 从 一 个 网 络 移 
动 到 男 一 个 网 络 时 保持 其 地 址 不 变 。 当 某 移 动 节 点 位 于 一 个 外 部 网 络 时 ， 所 有 指向 此 节点 
固定 地 址 的 流量 需要 导向 外 部 网 络 。 怎 样 才能 做 到 这 一 点 呢 ? 外 部 网 络 可 用 的 一 种 方法 就 
是 向 所 有 其 他 网 络 发 通告 ， 告 诉 它们 该 移动 节点 正在 它 的 网 络 中 。 这 通常 可 通过 交换 域内 
与 域 间 路 由 选择 信息 来 实现 ， 而 且 只 需 对 现 有 路 由 选择 基础 设施 做 很 少 的 改动 即 可 。 外 部 
网 络 只 需 通告 其 邻居 它 有 一 条 非常 特别 的 路 由 能 到 达 该 移动 节点 的 固定 地 址 ， 即 告诉 其 他 
网 络 它 有 一 条 正确 的 路 径 可 将 数据 报导 向 该 移动 节点 的 固定 地 址 〈《 即 基本 上 是 通知 其 他 网 
络 ， 它 有 一 条 可 将 数据 报 路 由 选择 到 该 移动 节点 的 永久 地 址 的 正确 路 径 ; 参见 4.3 节 )。 
这 些 邻 居 将 在 全 网 传播 该 路 由 选择 信息 ， 而 且 是 当 作 更 新 路 由 选择 信息 和 转发 表 的 正 浓 过 
程 的 一 部 分 来 做 。 当 移动 节点 离开 一 个 外 部 网 络 后 又 加 入 另 一 个 外 部 网 络 时 ， 新 的 外 部 网 
络 会 通告 一 条 新 的 通 向 该 移动 节点 的 特别 路 由 ， 旧 的 外 部 网 络 将 撤销 其 与 该 移动 节点 有 关 
的 路 由 选择 信息 。 

这 种 方法 立刻 解决 了 两 个 问题 ， 且 它 这 样 做 不 需 对 网 络 层 基础 设施 做 重大 改动 。 其 他 
网 络 知道 该 移动 节点 的 位 置 ， 很 容易 将 数据 报 路 由 到 该 移动 节点 ， 因 为 转发 表 将 这 些 数据 
报导 向 外 部 网 络 。 然 而 它 有 一 个 很 大 的 缺陷 ， 即 扩展 性 不 好 。 如 果 移 动 性 管理 是 网 络 路 由 
器 的 责任 的 话 ， 则 路 由 器 将 必须 维护 可 能 多 达 数 百 万 个 移动 节点 的 转发 表 表 项 。 在 本 章 后 
面 的 习题 中 将 探讨 一 些 其 他 的 缺陷 。 

一 种 替代 的 方法 (并 在 实际 中 得 到 了 采用 ) 是 将 移动 性 功能 从 网 络 核心 搬 到 网 络 边 
缘 ， 这 是 我 们 在 研究 因特网 体系 结构 时 一 再 重复 的 主题 。 一 种 自然 的 做 法 是 由 该 移动 节点 
的 归属 网 络 来 实现 。 与 那个 流动 青年 的 父母 跟踪 他 们 和 孩子 的 位 置 有 许多 相似 之 处 ， 在 移动 
节点 的 归属 网 络 中 的 归属 代理 也 能 跟踪 该 移动 节点 所 在 的 外 部 网 络 。 这 当然 需要 一 个 移动 
节点 (或 一 个 代表 该 移动 节点 的 外 部 代理 ) 与 归属 代理 之 间 的 协议 来 更 新 移动 节点 的 
位 置 。 

我 们 现在 更 详细 地 思考 外 部 代理 。 如 图 7-23 所 示 ， 概 念 上 最 简单 的 方法 是 将 外 部 代理 
放置 在 外 部 网 络 的 边缘 路 由 器 上 。 外 部 代理 的 作用 之 一 就 是 为 移动 节点 创建 一 个 所 谓 的 转交 
地 址 (Care-Of Address, COA), 该 COA 的 网 络 部 分 与 外 部 网 络 的 网 络 部 分 相 匹 配 。 因 此 一 
个 移动 节点 可 与 两 个 地 址 相关 联 ， 即 其 永久 地 址 (permanent address) (类 比 于 流动 青年 的 家 
庭 地 址 ) 与 其 COA， 该 COA 有 时 又 称 为 外 部 地 址 (foreign address) (类 比 于 流动 青年 当前 居 
住 的 房屋 地 址 ) 。 在 图 7-23 中 的 例子 中 ， 移 动 节点 的 固定 地 址 是 128. 119. 40. 186。 当 被 访 网 
络 为 79. 129. 13/24 时 ， 该 移动 节点 具有 的 COA 为 79. 129. 13. 2。 外 部 代理 的 第 二 个 作用 就 是 
告诉 归属 代理 ， 该 移动 节点 在 它 的 〈 外 部 代理 的 ) 网 络 中 且 具 有 给 定 的 COA。 我 们 很 快 就 会 
看 到 ， 该 COA 将 用 于 将 数据 报 通 过 外 部 代理 “重新 路 由 选择 ”到 移动 节点 。 

虽然 我 们 已 将 移动 节点 与 外 部 代理 的 功能 分 开 ， 但 是 应 当 注 意 到 移动 节点 也 能 承担 外 
部 代理 的 责任 。 例 如 ， 某 移动 节点 可 在 外 部 网 络 中 得 到 一 个 COA (使 用 一 个 诸如 DHCP 之 
类 的 协议 ) ， 且 由 它 自 己 把 其 COA 通告 给 归属 代理 。 


7.5.2 路 由 选择 到 移动 节点 


我 们 现在 已 看 到 一 个 移动 节点 是 如 何 得 到 一 个 COA 的 ， 归 属 代理 又 是 如 何 被 告知 该 
地 址 的 。 但 让 归属 代理 知道 该 COA 仅 能 解决 部 分 问题 。 数 据 报 应 怎样 寻 址 并 转发 给 移动 
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节点 呢 ? 因为 只 有 归属 代理 〈 而 不 是 全 网 的 路 由 器 ) 知道 该 移动 节点 的 位 置 ， 故 如 有 果 只 是 
将 一 个 数据 报 寻 址 到 移动 节点 的 永久 地 址 并 将 其 发 送 到 网 络 层 基础 结构 中 ， 这 样 做 已 不 再 
满足 需要 了 。 还 有 更 多 的 事情 要 做 。 目 前 有 两 种 不 同 的 方法 ， 我 们 将 称 其 为 间接 路 由 选择 
与 直接 路 由 选择 。 

1. 移动 节点 的 间接 路 由 选择 

我 们 先 考虑 一 个 想 给 移动 节点 发 送 数 据 报 的 通信 者 。 在 间接 路 由 选择 (indirect rou- 
ting) 方法 中 ， 通 信者 只 是 将 数据 报 寻 址 到 移动 节点 的 固定 地 址 ， 并 将 数据 报 发 送 到 网 络 
中 去 ， 完 全 不 知道 移动 节点 是 在 归属 网 络 中 还 是 正在 访问 某 个 外 部 网 络 ， 因 此 移动 性 对 于 
通信 者 来 说 是 完全 透明 的 。 这 些 数 据 报 就 像 平常 一 样 首 先导 回 移 动 节点 的 归属 网 络 。 这 用 
图 7-24 中 的 步骤 1 加 以 说 明 。 
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图 7-24 对 移动 节点 的 间接 路 由 选择 


我 们 现在 将 注意 力 转向 归属 代理 。 除 了 负责 与 外 部 代理 交互 以 跟踪 移动 节点 的 COA 
外 ， 归 属 代理 还 有 男 一 项 很 重要 的 功能 。 它 的 第 二 项 工作 就 是 监视 到 达 的 数据 报 ， 这 些 数 
据 报 寻 址 的 节点 的 归属 网 络 与 该 归属 代理 所 在 网 络 相同 ， 但 这 些 节点 当前 却 在 某 个 外 部 网 
络 中 。 归 属 代理 截获 这 些 数据 报 ， 然 后 按 一 个 两 步骤 的 过 程 转发 它们 。 通 过 使 用 移动 节点 
的 COA ， 该 数据 报 先 转发 给 外 部 代理 (图 7-24 中 的 步骤 2) ， 然 后 再 从 外 部 代理 转发 给 移 
By RA (PA 7-24 中 的 步骤 3)。 

仔细 地 思考 这 种 重新 路 由 选择 过 程 是 有 益 的 。 归 属 代理 需要 用 该 移动 节点 的 COA 来 
设置 数据 报 地 址 ， 以 便 网 络 层 将 数据 报 路 由 选择 到 外 部 网 络 。 在 为 一 方面 ， 需 要 保持 通信 
者 数据 报 的 原样 ， 因 为 接收 该 数据 报 的 应 用 程序 应 该 不 知道 该 数据 报 是 经 由 归属 代理 转发 
而 来 的 。 让 归属 代理 将 通信 者 的 原始 完整 数据 报 封 装 (encapsulate) 在 一 个 新 的 〈《 较 大 
的 ) 数据 报 中 ， 这 两 个 目标 都 可 以 得 到 满足 。 这 个 较 大 的 数据 报 被 导 回 并 交付 到 移动 节点 
AY COA, “HHA” GK COA 的 外 部 代理 将 接收 并 拆 封 该 数据 报 ， 即 从 较 大 的 封装 数据 报 中 取 
出 通信 者 的 原始 数据 报 ， 然 后 再 癌 移 动 节点 转发 该 原始 数据 报 (图 7-24 中 的 步骤 3 )。 
图 7-25 显 示 了 如 下 过 程 : 一 个 通信 者 向 归属 网 络 发 送 原始 数据 报 ; 向 外 部 代理 发 送 一 个 封 
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装 的 数据 报 ; 以 及 辕 移 动 节点 交付 最 初 的 数据 报 。 思 维 敏 锐 的 读者 将 会 注意 到 ， 这 里 描述 
的 封装 / 拆 封 概念 等 同 于 隧道 的 概念 ， 隧 道 是 在 4. 3 节 讨 论 IP 多 播 与 IPv6 时 涉及 的 。 
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图 7-25 封装 与 拆 封 


接 下 来 我 们 考虑 某 移动 节点 如 何 问 一 个 通信 者 发 送 数据 报 。 这 相当 简单 ， 因 为 移动 节 
点 可 直接 将 其 数据 报 寻 址 到 通信 者 (使 用 自己 的 永久 地 址 作为 源 地 址 ， 通 信者 的 地 址 作为 
目的 地 址 ) 。 因 为 移动 节点 知道 通信 者 的 地 址 ， 所 以 没有 必要 通过 归属 代理 迁 回 传送 数据 
报 。 这 就 是 显示 在 图 7-24 中 的 步骤 4。 

下 面 通过 列 出 支持 移动 性 所 需要 的 网 络 层 新 功能 ， 我 们 小 结 一 下 对 有 关 间 接 路 由 选择 
的 讨论 。 

© 移动 节点 到 外 部 代理 的 协议 。 当 移动 节点 连接 到 外 部 网 络 时 ， 它 向 外 部 代理 注册 。 

类 似 地 ， 当 一 个 移动 节点 离开 该 外 部 网 络 时 ， 它 将 回 外 部 代理 取消 注册 。 

o 外 部 代理 到 归属 代理 的 注册 协议 。 外 部 代理 将 回归 属 代 理 注 册 移 动 节点 的 COA, 
当 某 移动 节点 离开 其 网 络 时 ， 外 部 代理 不 需要 显 式 地 注销 COA， 因 为 当 移动 节点 
移动 到 一 个 新 网 络 时 ， 随 之 而 来 就 要 注册 一 个 新 的 COA， 这 将 完成 了 注销 。 
归属 代理 数据 报 封装 协议 。 将 通信 者 的 原始 数据 报 封装 在 一 个 目的 地 址 为 COA 的 
数据 报 内 ， 并 转发 之 。 

© 外 部 代理 拆 封 协议 。 从 封装 好 的 数据 报 中 取出 通信 者 的 原始 数据 报 ， 然 后 再 将 该 

原始 数据 报 转发 给 移动 节点 。 

上 述 讨论 提供 了 一 个 移动 节点 在 网 络 之 间 移 动 时 要 维持 一 个 不 间断 的 连接 所 需 的 各 部 
分 : 外 部 代理 、 归 属 代理 和 间接 转发 。 举 一 个 例子 来 说 明 这 些 部 分 是 如 何 协同 工作 的 。 假 
设 某 移动 节点 连 到 外 部 网 络 A， 向 其 归属 代理 注册 了 网 络 A 中 的 一 个 COA， 并 且 正 在 接收 
通过 归属 代理 间接 路 由 而 来 的 数据 报 。 该 移动 节点 现在 移动 到 外 部 网 络 B 中 ， 并 向 网 络 B 
中 的 外 部 代理 注册 ， 外 部 代理 将 该 移动 节点 的 新 COA 告诉 了 其 归属 代理 。 此 后 ， 归 属 代 
理 将 数据 报 重 路 由 到 网 络 B。 就 一 个 通信 者 关心 的 东西 而 言 ， 移 动 性 是 透明 的 ， 即 在 移动 
前 后 ， 数 据 报 都 是 由 相同 的 归属 代理 进行 路 由 选择 。 就 归属 代理 关心 的 东西 而 言 ， 数 据 报 
流 没有 中 断 ， 即 到 达 的 数据 报 先 是 转发 到 外 部 网 络 A; 改变 COA 后 ， 则 数据 报 转发 到 外 
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部 网 络 B。 但 当 移 动 节点 在 网 络 之 间 移 动 时 ， 它 会 看 到 数据 报 流 中 断 吗 ? 只 要 移动 节点 与 
网 络 A 断 开 连接 〈 此 时 它 不 能 再 经 A 接收 数据 报 ) 再 连接 到 网 络 B (此 时 它 将 向 归属 代 
理 注册 一 个 新 的 COA) 用 的 时 间 少 ， 那 么 几乎 没有 丢失 数据 报 。 第 3 章 讲 过 ， 端 到 端 连 接 
可 能 会 由 于 网 络 拥塞 而 丢失 数据 报 。 因 而 当 一 个 节点 在 网 络 之 间 移 动 时 ， 一 条 连接 中 的 数 
据 报 偶尔 丢失 算 不 上 什么 灾难 性 问题 。 如 果 需 要 进行 无 丢失 的 通信 ， 则 上 层 机 制 将 对 数据 
报 丢失 进行 恢复 ， 不 管 这 种 丢失 是 因 网 络 拥塞 还 是 因 用 户 移动 而 引发 的 。 

在 移动 IP 标准 中 使 用 了 一 种 间接 路 由 选择 方法 [RFC 5944 ] ， 这 将 在 7.6 节 中 讨论 。 

2. 移动 节点 的 直接 路 由 选择 

在 图 7-24 中 阐述 了 间接 路 由 选择 方法 存在 一 个 低 效 的 问题 ， 即 三 角 路 由 选择 问题 
(triangle routing problem) 。 该 问题 是 指 即 使 在 通信 者 与 移动 节点 之 间 存 在 一 条 更 有 效 的 路 
由 ， 发 往 移 动 节点 的 数据 报 也 要 先 发 给 归属 代理 ， 然 后 再 发 送 到 外 部 网 络 。 在 最 坏 情况 
下 ， 设 想 一 个 移动 用 户 正 在 访问 一 位 同行 所 在 的 外 部 网 络 ， 两 人 并 排 坐 在 一 起 且 正 在 通过 
网 络 交换 数据 。 从 通信 者 (在 该 例 中 为 该 访问 者 的 同行 ) 处 发 出 的 数据 报 被 路 由 选择 到 该 
移动 用 户 的 归属 代理 ， 然 后 再 回 到 该 外 部 网 络 ! 

直接 路 由 选择 (direct routing) 克服 了 三 角 路 由 选择 的 低 效 问 题 ， 但 却 是 以 增加 复 
杂 性 为 代价 的 。 在 直接 路 由 选择 方法 中 ， 通 信者 所 在 网 络 中 的 一 个 通信 者 代理 (corre- 
spondent agent) 先知 道 该 移动 节点 的 COA。 这 可 以 通过 让 通信 者 代理 向 归属 代理 询问 得 
知 ， 这 里 假设 与 间接 路 由 选择 情况 类 似 ， 移 动 节点 具有 一 个 在 归属 代理 注册 过 的 最 新 的 
COA。 与 移动 节点 可 以 执行 外 部 代理 的 功能 相 类 似 ， 通 信者 本 身 也 可 能 执行 通信 者 代理 
的 功能 。 在 图 7-26 中 显示 为 步骤 1 和 步骤 2。 通 信者 代理 然后 将 数据 报 直 接 通过 隧道 技 
术 发 往 移动 节点 的 COA， 这 与 归属 代理 使 用 的 隧道 技术 相 类 似 ， 参 见 图 7-26 的 步骤 3 
和 步骤 4。 
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图 例 : ~ 
一 一 ”控制 报 文 — 数据 流 
图 7-26 到 某 移动 用 户 的 直接 路 由 选择 
尽管 直接 路 由 选择 克服 了 三 角 路 由 选择 问题 ， 但 它 引 入 了 两 个 重要 的 其 他 挑战 : 
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© 需要 一 个 移动 用 户 定位 协议 ( mobile-user location protocol), ， 以 便 通信 者 代理 向 归 
属 代 理 查 询 获 得 移动 节点 的 COA (图 7-26 中 的 步骤 1 和 步骤 2)。 
© 当 移动 节点 从 一 个 外 部 网 络 移 到 另 一 个 外 部 网 络 时 ， 如 何 将 数据 报 转 发 到 新 的 外 
部 网 络 ? 在 间接 路 由 选择 的 情况 下 ， 这 个 问题 可 以 容易 地 通过 更 新 由 归属 代理 维 
持 的 COA 来 解决 。 然 而 ， 使 用 直接 路 由 选择 时 ， 归 属 代 理 仅 在 会 话 开 始 时 被 通信 
者 代理 询问 一 次 COA。 因 此 ， 当 必要 时 在 归属 代理 中 更 新 COA， 这 并 不 足以 解决 
将 数据 路 由 选择 到 移动 节点 新 的 外 部 网 络 的 问题 。 
一 种 解决 方案 是 创建 一 个 新 的 协议 来 告知 通信 者 变化 后 的 COA。 另 一 种 方案 也 是 在 
GSM 网 络 实践 中 所 采用 的 方案 ， 它 的 工作 方式 如 下 。 假 设 数据 当前 正 转发 给 位 于 某 个 外 部 
网 络 中 的 移动 节点 ， 并 且 在 会 话 刚 开始 时 该 移动 节点 就 位 于 该 网 络 中 (图 7-27 中 的 步骤 
1 ) 。 我 们 将 首次 发 现 移 动 节点 的 外 部 网 络 中 的 外 部 代理 标识 为 锚 外 部 代理 (anchor foreign 
agent) 。 当 移动 节点 到 达 一 个 新 外 部 网 络 后 (图 7-27 中 的 步骤 2) ， 移 动 节点 向 新 的 外 部 
代理 注册 (步骤 3)， 并 且 新 外 部 代理 向 锚 外 部 代理 提供 移动 节点 的 新 COA (步骤 4)。 当 
锚 外 部 代理 收 到 一 个 发 往 已 经 离开 的 移动 节点 的 封装 数据 报 后 ， 它 可 以 使 用 新 的 COA 重 
新 封装 数据 报 并 将 其 转发 给 该 移动 节点 (步骤 5)。 如 果 移 动 节点 其 后 又 移 到 男 一 个 外 部 


网 络 中 ， 在 该 被 访 网 络 中 的 外 部 代理 随后 将 与 鳃 外 部 代理 联系 ， 以 便 建立 到 该 新 外 部 网 络 
的 转发 。 
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图 7-27 在 网 络 间 使 用 直接 路 由 选择 的 移动 转移 


7.6 移动 IP 


支持 移动 性 的 因特网 体系 结构 与 协议 合 起 来 称 为 移动 IP， 对 IPv4 主要 由 RFC 5944 定 
义 。 移 动 IP 是 一 个 灵活 的 标准 ， 支 持 许 多 不 同 的 运行 模式 (例如 ， 具 有 或 不 具有 外 部 代 
理 的 运行 ) ， 代 理 与 移动 节点 相互 发 现 的 多 种 方式 ， 使 用 单个 或 多 个 COA， 以 及 多 种 形式 
的 封装 。 同 样 ， 移 动 IP 是 一 个 复杂 的 标准 ， 需 要 用 整 本 书 才 能 详细 描述 ;的 确 有 这 样 一 
本 书 [Perkins 1998b |。 这 里 ， 我 们 最 基本 的 目标 是 对 移动 IP 最 重要 的 部 分 进行 概述 ， 并 
说 明 它 在 一 些 常见 情 形 中 的 使 用 。 
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移动 IP 体系 结构 包含 了 许多 我 们 前 面 考 虑 过 的 要 素 ， 包 括 归 属 代理 、 外 部 代理 、 转 
交 地 址 和 封装 / 拆 封 等 概念 。 当 前 的 标准 [RFC 5944] 规定 到 移动 节点 使 用 间接 路 由 选择 
的 方法 。 

移动 IP 标准 由 三 部 分 组 成 : 

© 代理 发 现 。 移 动 下 定义 了 一 个 归属 代理 或 外 部 代理 用 来 向 移动 节点 通告 其 服务 的 

协议 ， 以 及 移动 节点 请 求 一 个 外 部 代理 或 归属 代理 的 服务 所 使 用 的 协议 。 

© 向 归属 代理 注册 。 移 动 IP 定义 了 移动 节点 和 /或 外 部 代理 加 一 个 移动 节点 的 归属 

代理 注册 或 注销 COA 所 使 用 的 协议 。 

© 数据 报 的 间接 路 由 选择 。 该 标准 也 定义 了 数据 报 被 一 个 归属 代理 转发 给 移动 节点 

的 方式 ， 包 括 转 发 数据 报 使 用 的 规则 、 处 理 差 错 情况 的 规则 和 几 种 不 同 的 封装 形 
xk [RFC 2003; RFC 2004 | 。 

在 整个 移动 P 标准 中 安全 性 的 考虑 是 很 重要 的 。 例 如 ， 显 然 需 要 对 一 个 移动 节点 进 
行 鉴别 以 确保 一 个 亚 意 用 户 不 能 向 归属 代理 注册 一 个 伪造 的 转交 地 址 ， 伪 造 地 址 将 导致 所 
有 发 给 某 个 IP 地址 的 数据 报 被 重 定向 到 恶意 用 户 。 移 动 IP 使 用 许多 机 制 来 实现 安全 性 ， 
我 们 将 在 第 8 章 考察 这 些 机 制 ， 在 以 下 的 讨论 中 将 不 考虑 安全 性 问题 。 

1. 代理 发 现 

到 达 一 个 新 网 络 的 某 移动 IP 节点 ,不 管 是 连 到 一 个 外 部 网 络 还 是 返回 其 归属 网 络 ， 
它 都 必须 知道 相应 的 外 部 代理 或 归属 代理 的 身份 。 的 确 ， 这 是 新 外 部 代理 的 发 现 ， 通 过 一 
个 新 的 网 络 地 址 ， 才 使 移动 节点 中 的 网 络 层 知 道 它 已 进入 一 个 新 的 外 部 网 络 。 这 个 过 程 被 
称 为 代理 发 现 (agent discovery ) 。 代 理发 现 可 以 通过 下 列 两 种 方法 之 一 实现 : 经 代理 通告 
或 者 经 代理 请 求 。 

借助 于 代理 通告 (agent advertisement) ， 外 部 代理 或 归属 代理 使 用 一 种 现 有 路 由 器 发 
现 协议 的 扩展 协议 [RFC 1256] 来 通告 其 服务 。 该 代理 周期 性 地 在 所 有 连接 的 链 路 上 广 
播 一 个 类 型 字段 为 9 (路 由 器 发 现 ) 的 ICMP FRC. Pr aeRO ae (BIA 
代理 ) 的 全 地址 ， 因 此 允许 一 个 移动 节点 知道 该 代理 的 IP 地 址 。 路 由 顺 发 现 报 文 还 包括 
了 一 个 移动 性 代理 通告 扩展 ， 其 中 包含 了 该 移动 节点 所 需 的 附加 信息 。 在 这 种 扩展 中 有 如 
下 一 些 较 重 要 的 字段 : 

o 归属 代理 比特 《〈H) 。 指 出 该 代理 是 它 所 在 网 络 的 一 个 归属 代理 。 

© 外 部 代理 比特 〈(F) 。 指 出 该 代理 是 它 所 在 网 络 的 一 个 外 部 代理 。 

© 注册 要 求 比 特 〈R) 。 指 出 在 该 网 络 中 的 某 个 移动 用 户 必须 向 某 个 外 部 代理 注册 。 

特别 是 ， 一 个 移动 用 户 不 能 在 外 部 网 络 (如 使 用 DHCP) 中 获得 一 个 转交 地 址 ， 
并 假定 由 它 自己 承担 外 部 代理 的 功能 ， 无 须 向 外 部 代理 注册 。 

e M、G 封装 比特 。 指 出 除了 “IP PAY IP” (IP-in-IP) 封装 形式 外 ， 是 否 还 要 用 其 
他 的 封装 形式 。 

o 转交 地 址 (COA) 字段 。 由 外 部 代理 提供 的 一 个 或 多 个 转交 地 址 的 列表 。 在 下 面 
的 例子 中 ，COA 将 与 外 部 代理 关联 ， 外 部 代理 将 接收 发 给 该 COA 的 数据 报 ， 然 后 
再 转发 到 适当 的 移动 节点 。 移 动用 户 在 向 其 归属 代理 注册 时 将 选择 这 些 地 址 中 的 
一 个 作为 其 COA。 

图 7-28 说 明了 在 代理 通告 报 文 中 的 某 些 关键 字段 。 
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图 7-28 具有 移动 性 代理 通告 扩展 的 ICMP 路 由 器 发 现 报 文 


使 用 代理 请 求 (agent solicitation) ， 一 个 想 知道 代理 的 移动 节点 不 必 等 待 接 收 代 理 通 
告 ， 就 能 广播 一 个 代理 请 求 报 文 ， 该 报 文 只 是 一 个 类 型 值 为 10 的 ICMP 报 文 。 收 到 该 请 求 
的 代理 将 直接 向 该 移动 节点 单 播 一 个 代理 通告 ， 于 是 该 移动 节点 将 继续 处 理 ， 就 好 像 刚 收 
到 一 个 未 经 请 求 的 通告 一 样 。 

2. 向 归属 代理 注册 

一 旦 某 个 移动 IP 节点 收 到 一 个 COA， 则 该 地 址 必须 要 向 归属 代理 注册 。 这 可 通过 外 
部 代理 ( 由 它 向 归属 代理 注册 该 COA) 或 直接 通过 移动 PP 节点 自己 来 完成 。 我 们 下 面 考 
虑 前 一 种 情况 ， 共 涉及 4 个 步骤 。 

1) 当 收 到 一 个 外 部 代理 通告 后 ， 一 个 移动 节点 立即 问 外 部 代理 发 送 一 个 移动 耻 注册 
报 文 。 注 册 报 文 承载 在 一 个 UDP 数据 报 中 并 通过 端口 434 发 送 。 注 册 报 文 携带 以 下 内 容 : 
一 个 由 外 部 代理 通告 的 COA、 归 属 代理 的 地 址 (HA)、 移 动 节 点 的 永久 地 址 (MA) 、 请 
求 的 注册 寿命 和 一 个 64 比特 的 注册 标识 。 请 求 的 注册 寿命 指示 了 注册 有 效 的 秒 数 。 如 采 
注册 没有 在 规定 的 时 间 内 在 归属 代理 上 更 新 ， 则 该 注册 将 变 得 无 效 。 注 册 标 识 就 像 一 个 序 
号 ， 用 于 收 到 的 注册 回答 与 注册 请 求 的 匹配 〈 下 面 会 讨论 ) 。 

2) 外 部 代理 收 到 注册 报 文 并 记录 移动 节点 的 永久 IP 地 址 。 外 部 代理 知道 现在 它 应 该 
查找 这 样 的 数据 报 ， 即 它 封 装 的 数据 报 的 目的 地 址 与 该 移动 节点 的 永久 地 址 相 匹配 。 外 部 
代理 然后 向 归属 代理 的 434 端口 发 送 一 个 移动 IP 注册 报 文 (同样 封装 在 UDP 数据 报 中 ) 。 
这 一 报 文 包括 COA、HA 、MA 、 封 装 格式 要 求 、 请 求 的 注册 寿命 以 及 注册 标识 。 

3) 归属 代理 接收 注册 请 求 并 检查 真实 性 和 正确 性 。 归 属 代理 把 移动 节点 的 永久 IP 地 
址 与 COA 绑 定 在 一 起 。 以 后 ， 到 达 该 归属 代理 的 数据 报 与 发 往 移动 节点 的 数据 报 将 被 封 
装 并 以 隧道 方式 给 COA。 归 属 代理 发 送 一 个 移动 IP 注册 回答 ， 该 啊 应 报 文中 包含 有 HA, 
MA、 实 际 注册 寿命 和 被 认可 的 请 求 报 文 注册 标识 。 

4) 外 部 代理 接收 注册 啊 应 ， 然 后 将 其 转发 给 移动 节点 。 

到 此 ， 注 册 便 完 成 了 ， 移 动 节点 就 能 接收 发 送 到 其 永久 地 址 的 数据 报 。 图 7-29 说 明 
了 这 些 步 又。 注意 到 归属 代理 指定 的 寿命 比 移动 节点 请 求 的 寿命 要 小 。 
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当 某 个 移动 节点 离开 其 网 络 时 ， 外 部 代理 无 须 显 式 地 取消 某 个 COA 的 注册 。 当 移动 
节点 移动 到 一 个 新 网 (不管 是 另 一 个 外 部 网 络 还 是 其 归属 网 络 ) 并 注册 一 个 新 COA 时 ， 
上 述 情 况 将 自动 发 生 。 

除了 上 面 所 描述 的 情况 ， 移动 IP 标准 还 允许 许多 另外 的 情形 和 功能 ， 有 兴趣 的 读者 
可 以 参阅 [Perkins 1998b; RFC 5944], 


7.7 管理 蜂窝 网 中 的 移动 性 


分 析 了 P 网 络 中 的 移动 性 管理 以 后 ， 我 们 现 将 注意 力 转向 对 移动 性 支持 有 更 长 历史 
的 网 络 ， 即 蜂窝 电话 网 络 。 尺 管 在 7.4 节 中 我 们 关注 过 蜂窝 网 中 的 第 一 跳 无 线 链 路 ， 但 这 
里 我 们 关注 移动 性 ， 并 以 CSM 蜂 赛 网 络 体系 结构 [Goodman 1997; Mouly 1992; Scourias 
2012; Kaaranen 2001; Korhonen 2003; Turner 2012] 作为 学 习 案 例 ， 因 为 它 是 一 个 成 熟 并 
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被 广泛 部 署 的 技术 。3G 和 4G 网 络 中 的 移动 性 原则 上 与 CSM 中 所 使 用 的 移动 性 类 似 。 与 
在 移动 IP 中 的 情况 类 似 ， 我 们 将 会 看 到 7. 5 节 指 出 的 许多 基本 原理 都 被 包含 在 GSM 网 络 
体系 结构 中 。 
与 移动 IP 类 似 ，GSM 采用 了 一 种 间接 路 由 选择 方法 (参见 7.5.2 节 )， 首 先 将 通信 者 
的 呼叫 路 由 选择 到 移动 节点 的 归属 网 络 ， 再 从 那 到 达 被 访 网 络 。 在 CSM 术语 中 ， 移 动用 
户 的 归属 网 络 被 称 作 该 移动 用 户 的 归属 公共 地 域 移动 网 络 (home Public Land Mobile 
Network, home PLMN ) 。 由 于 首 字 母 缩 略 词 PLMN 有 些 扫 口 ， 考 虑 到 我 们 避免 缩 略 词 字 母 
表 的 要 求 ， 我 们 直接 将 GSM 归属 PLMN 称 为 归属 网 络 (home network ) 。 移 动用 户 回 某 个 
蜂窝 网 提供 商 订 购 了 服务 ， 该 蜂 突 网 就 成 为 了 这 些 用 户 的 归属 网 络 ( 即 该 提供 商 就 按 月 提 
供 的 蜂 窗 服务 收取 用 户 的 费用 )。 被 访问 的 PLMN， 我 们 直接 称 其 为 被 访 网 络 (visited 
network) ， 是 移动 用 户 当前 所 在 网 络 。 
与 移动 IP 中 情况 类 似 ， 归 属 网 络 和 被 访 网 络 的 职责 有 很 大 的 差别 。 
© 归属 网 络 维护 一 个 称 作 归属 位 置 注册 器 ( Home Location Register, HLR) 的 数据 
库 ， 其 中 包括 它 每 个 用 户 的 永久 蜂 帘 电话 号 码 以 及 用 户 个 人 概要 信息 。 重 要 的 是 ， 
HLR 也 包括 这 些 用 户 当 前 的 位 置信 息 。 这 就 是 说 ， 如 果 一 个 移动 用 户 当 前 漫游 到 
男 一 个 提供 商 的 蜂窝 网 络 中 ，HLR 中 将 包含 足够 多 的 信息 来 获取 (通过 一 个 我 们 
即将 描述 的 过 程 ) 被 访 网 络 中 对 移动 用 户 的 呼叫 应 该 路 由 选择 到 的 地 址 。 我 们 将 
会 看 到 ， 当 一 个 呼叫 定位 到 一 个 移动 用 户 后 ， 通 信者 将 与 归属 网 络 中 一 个 被 称 作 
网 关 移 动 服务 交换 中 心 (Gateway Mobile services Switching Center, GMSC) 的 特殊 
交换 机 联系 。 同 样 ， 为 避免 擂 口 的 缩 略 词 ， 我 们 这 里 用 一 个 更 具 描 述 性 的 术语 来 
称呼 GMSC， 即 归属 MSC (home MSC) 。 
© 被 访 网 络 维护 一 个 称 作 访问 者 位 置 注 册 (Visitor Location Register, VLR) 的 数据 
库 。VLR 为 每 一 个 当前 在 其 服务 网 络 中 的 移动 用 户 包含 一 个 表 项 ，VLR 表 项 因此 
随 着 移动 用 户 进 入 和 离开 网 络 而 出 现 或 消失 。VLR 通常 与 移动 交换 中 心 (MSC ) 
在 一 起 ， 该 中 心 协 调 到 达 或 离开 被 访 网 络 的 呼叫 建立 。 
在 实践 中 ， 一 个 服务 商 的 蜂窝 网 络 将 为 其 用 户 提 供 归 属 网 络 服 务 ， 同 时 为 在 其 他 蜂窝 
服务 商 订 购 服 务 的 移动 用 户 提 供 被 访 网 络 服务 。 


7.7.1 对 移动 用 户 呼 叫 的 路 由 选择 


现在 我 们 描述 一 个 呼叫 如 何 定位 到 被 访 网 络 中 的 一 个 移动 CSM 用 户 。 我 们 首先 考虑 
下 面 一 个 简单 的 例子 ， 更 复杂 的 例子 在 [Mouly 1992] 中 有 描述 。 如 图 7-30 所 示 ， 这 些 步 
IRUN F: 

|) 通信 者 拨打 移动 用 户 的 电话 号 码 。 该 号 码 本 吴 并 不 涉及 一 个 特定 的 电话 线路 或 位 
置 (毕竟 电话 号 码 是 固定 的 ， 而 用 户 是 移动 的 ) ， 号 码 中 的 前 几 位 数字 足以 全 局 地 判别 移 
动用 户 的 归属 网 络 。 呼 叫 从 通信 者 通过 公共 交换 电话 网 到 达 移 动用 户 归 属 网 络 中 的 归属 
MSC。 这 是 呼叫 的 第 一 步 。 

2) 归属 MSC 收 到 该 呼叫 并 查询 HLR 来 确定 移动 用 户 的 位 置 。 在 最 简单 的 情况 下 ， 
HLR 返回 移动 站 点 漫游 号 码 (Mobile Station Roaming Number, MSRN), 我们 称 其 为 漫游 号 
码 (roaming number)。 注 意 到 这 个 号 人 码 与 移动 用 户 的 永久 电话 号 码 不 同 ， 后 者 是 与 移动 用 
户 的 归属 网 络 相 关联 的 ， 而 漫游 号 码 是 短暂 的 : 当 移 动用 户 进 入 一 个 被 访 网 络 后 ， 会 给 移 
动用 户 临 时 分 配 一 个 漫游 号 码 。 漫 游 号 码 的 作用 就 相当 于 移动 卫 中 转交 地 址 的 作用 。 并 
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且 ， 与 COA 类 似 ， 它 也 是 对 通信 者 和 移动 用 户 不 可 见 的 。 如 果 HLR 不 具有 该 漫游 号 码 ， 
它 返 回 被 访 网 络 中 VLR 的 地 址 。 在 这 种 情况 下 (未 在 图 7-30 中 显示 出 来 ) HE MSC 需 
要 查询 VLR 以 便 获取 移动 节点 的 漫游 号 码 。 但 是 HLR 是 如 何 首 先 得 到 漫游 号 码 或 VLR 地 
址 的 呢 ? 移动 用 户 到 另 一 个 被 访 网 络 后 这 些 值 将 发 生 怎样 的 变化 ?我们 将 很 快 考虑 这 些 重 
要 问题 。 





图 7-30 将 呼叫 定位 到 一 个 移动 用 户 : 间接 路 由 选择 


3) 给 定 一 个 漫游 号 码 ， 归 属 MSC 通过 网 络 到 达 被 访 网 络 的 MSC 建立 呼叫 的 第 二 步 。 
至 此 ， 该 呼叫 已 经 完成 ， 从 通信 者 到 达 归 属 MSC， 再 从 归属 MSC 到 达 被 访 MSC， 然 后 到 
达 为 移动 用 户 提供 服务 的 基站 。 

在 第 二 步 中 ， 一 个 未 解决 的 问题 是 HLR 如 何 获 得 有 关 移 动用 户 位 置 的 信息 。 当 一 个 
移动 电话 切换 或 进入 一 个 由 新 的 VLR 所 覆盖 的 被 访 网 络 中 以 后 ， 移 动用 户 必须 向 被 访 网 
络 注册 ， 这 是 通过 在 移动 用 户 和 VLR 之 间 交 换 信 令 报 文 来 实现 的 。 被 访 VLR 随后 又 向 移 
动用 户 的 HLR 发 送 一 个 位 置 更 新 请 求 报 文 。 这 一 报 文告 知 HLR 可 以 用 来 联系 移动 用 户 的 
漫游 号 码 ， 或 者 VLR Ht 〈 它 可 以 用 来 随后 查询 以 获取 移动 号 码 ) 。 作 为 这 个 交换 的 一 部 
分 ，VLR 同样 从 HLR 那里 获取 移动 用 户 的 信 
息 ， 以 及 确定 被 访 网 络 应 该 给 予 移 动用 户 什 么 
样 的 服务 (如 果 有 的 话 ) 。 


7.7.2 GSM 中 的 切换 


在 一 个 呼叫 过 程 中 ， 移 动 站 点 将 其 关联 从 
一 个 基站 改变 到 另 一 个 基站 时 出 现 切换 (hand- 
off) 。 如 图 7-31 所 示 ， 移 动用 户 的 呼叫 初始 时 
(在 切换 前 ) 通过 一 个 基站 (我 们 称 其 为 旧 基 
站 ) 路 由 选择 到 该 移动 用 户 ， 而 在 切换 以 后 它 图 7-31 具有 一 个 公共 MSC 的 
经 过 另 一 个 基站 (我 们 称 其 为 新 基站 ) 路 由 选 基站 则 的 切换 情况 





旧 的 BS 新 的 BS 
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择 到 移动 用 户 。 注 意 到 基站 之 间 的 切换 不 仅 导 致 移动 用 户 向 /从 一 个 新 的 基站 传输 /接收 信 
5, 而且 导 致 正在 进行 的 呼叫 从 网 络 中 的 一 个 交换 点 到 新 基站 的 重 路 由 选择 。 我 们 首先 假 
设 新 旧 基 站 共享 同一 个 MSC， 并 且 重 路 由 选择 发 生 在 这 个 MSC。 

有 几 种 原因 导致 切换 的 发 生 ， 包 括 : 中 当前 基站 和 移动 用 户 之 间 的 信号 减弱 ， 使 得 该 
呼叫 有 被 中 断 的 危险 ; @) 一 个 蜂窝 处 理 的 呼叫 太 多 ， 变 得 过 载 。 可 以 通过 将 一 些 移动 用 户 
切换 到 邻近 不 太 拥 塞 的 蜂 窜 中， 使 这 个 拥塞 得 到 缓解 。 

在 与 一 个 基站 相关 联 期 间 ， 移 动用 户 周 期 性 地 测量 来 自 其 当前 基站 和 临近 它 的 可 以 
“ 听 得 到 ”的 基站 的 信 标 信号 强度 。 这 些 测量 以 每 秒 1 ~2 次 的 频率 报告 给 移动 用 户 的 当前 
基站 。 根 据 这 些 测 量 值 、 临 近 蜂窝 的 移动 用 户 的 当前 负载 以 及 其 他 因素 ，GSM 中 的 切换 由 
旧 的 基站 发 起 [Mouly 1992 ] 。GSM 标准 并 未 明确 规定 基站 在 确定 是 否 进行 切换 时 所 采用 
的 具体 算法 。 

图 7-32 显示 了 当 一 个 基站 决定 切换 一 个 
移动 用 户 时 所 包括 的 步骤 : 

1) 旧 基 站 (BS) 通知 被 访问 MSC 即将 
要 进行 一 个 切换 ， 通 知 移动 用 户 将 要 切换 到 
的 BS (或 可 能 的 BS 集 ) 。 





<>) 

2) 被 访问 MSC 发 起 建立 到 新 BS 的 路 A + 
径 ， 分 配 承载 重 路 由 选择 的 呼叫 所 需 的 资源 ， SO Zig wens 
以 及 用 信 令 告知 新 BS 一 个 切换 即将 出 现 。 

3) 新 BS 分 配 并 激活 一 个 无 线 信道 供 移 00 
动用 户 使 用 。 图 7-32 具有 一 个 公共 MSC 的 基站 间 

4) 新 BS 发 出 信 令 返回 被 访问 MSC ANIA 完成 一 个 切换 的 步 又 
BS， 即 已 经 建立 了 被 访问 MSC 到 新 BS 的 路 径 并 且 移 动用 户 应 当 被 告知 即将 发 生 的 切换 。 
新 BS 提供 移动 用 户 与 新 的 BS 相关 联 所 需要 的 所 有 信息 。 

5) 移动 用 户 被 告知 它 应 当 进 行 一 个 切换 。 注 意 到 此 时 为 止 ， 移 动用 户 完 全 不 知 网 络 
已 经 为 切换 做 好 所 有 底层 工作 ( 如 在 新 BS 中 分 配 一 个 信道 ， 分 配 一 条 从 被 访问 MSC 到 新 
BS 的 路 径 ) 。 

6) 移动 用 户 和 新 BS 交换 一 个 或 多 个 报 文 ， 以 完全 激活 新 BS 中 新 的 信道 。 

7) 移动 用 户 向 新 BS 发 送 一 个 切换 完成 报 文 ， 该 报 文 随后 向 上 转发 给 被 访问 MSC。 
该 被 访问 MSC 然后 重 路 由 选择 到 移动 用 户 的 正在 进行 的 呼叫 ， 使 其 经 过 新 BS。 

8) 沿 着 到 旧 BS 的 路 径 分 配 的 资源 随后 被 释放 。 

通过 考虑 如 下 情况 来 总 结 我 们 对 切换 的 讨论 ; 当 移 动用 户 移动 到 一 个 不 同 于 旧 BS 的 、 
与 不 同 的 MSC 关联 的 BS 中 时 ， 并 且 当 这 种 MSC 之 间 的 切换 多 次 发 生 时 ， 考 虑 这 些 情况 下 
将 发 生 什 么 。 如 图 7-33 Aras, GSM 定义 了 锚 MSC (anchor MSC) 的 概念 。 销 MSC 是 呼叫 
首次 开始 时 移动 用 户 所 访问 的 MSC， 它 因此 在 整个 呼叫 持续 过 程 中 保持 不 变 。 在 整个 呼叫 
持续 期 间 ， 不 论 移 动用 户 进 行 了 多 少 次 MSC 间 转 换 ， 呼 叫 总 是 从 归属 MSC 路 由 选择 到 锚 
MSC ， 然 后 再 到 移动 用 户 当 前 所 在 的 被 访问 MSC。 当 移动 用 户 从 一 个 MSC 覆盖 区 到 达 另 
一 个 MSC 覆盖 区 后 ， 正 在 进行 的 呼叫 被 重 路 由 选择 ， 从 锚 MSC 到 包含 新 基站 的 新 被 访问 
MSC。 因 此 ， 在 任何 情况 下 ， 通 信者 和 移动 用 户 之 间 至 多 有 3 个 MSC (归属 MSC, 、 锚 MSC 
以 及 被 访问 MSC) 。 图 7-33 图 示 了 在 移动 用 户 所 访问 的 MSC 之 间 的 一 个 呼叫 的 路 由 选择 。 





a) 切换 前 
图 7-33 ”通过 锚 MSC 重 路 由 选择 


另 一 种 方法 则 不 用 维持 从 锚 MSC 到 当前 MSC 的 单一 MSC 跳 ， 将 直接 链接 移动 用 户 访 
问 的 MSC。 每 当 移 动用 户 移 到 一 个 新 MSC 后 ， 让 旧 MSC 将 正在 进行 的 呼叫 转发 给 新 
MSC。 这 种 MSC 链 事实 上 能 够 出 现在 IS-41 蜂窝 网 络 中 ， 通 过 使 用 最 少 步骤 的 可 选 路 径 来 
ERE MSC 和 当前 访问 MSC 之 间 的 MSC [Lin 2001], 

下 面 通过 对 比 GSM 和 移动 IP 中 的 移动 性 管理 ,来 完成 我 们 对 CSM 移动 性 管理 的 讨 
论 。 表 7-2 中 的 对 比 指出 了 尽管 IP 和 蜂窝 网 络 在 很 多 方面 有 很 大 的 区 别 ， 但 它们 共享 数量 
惊人 的 公共 功能 要 素 和 处 理 移动 性 的 总 体 方法 。 


表 7-2 移动 IP 和 GSM 移动 性 之 间 的 共性 


GSM 要 素 对 GSM 要 素 的 解释 移动 IP 要 素 
归属 系统 移动 用 户 永久 电话 号 码 所 归属 的 网 络 归属 网 络 


归属 MSC: 获取 移动 用 户 路 由 地 址 的 联系 点 。HLR : 


网 关 移动 (服务 ) 交换 中 心 或 简称 m 
HRMSC, RMN (HLR) | 归属 系统 中 包含 移动 用 户 永久 电话 号 码 、 个 人 信息 、| BARE 


当前 位 置 和 订购 信息 的 数据 库 


被 访问 系统 移动 用 户 当 前 所 在 的 非 归 属 系统 网 络 被 访 网 络 


被 访问 移动 (服务 ) 交换 中 心 或 简 被 访问 MSC: 负责 建立 与 MSC 相关 联 的 发 射 区 中 
称 被 访问 MSC， 访 问 者 定位 记录 | 到 /从 移动 节点 的 呼叫 。VLR: 访问 系统 中 的 临时 数据 
( VLR) 库 项 ， 包 含 每 个 访问 移动 用 户 的 订购 信息 


移动 站 点 漫游 号 码 (MSRN ) ， 或 漫 用 于 归属 MSC 和 被 访问 MSC 之 间 电 话 呼叫 的 路 由 地 转交 地 址 
游 号 码 址 ， 对 移动 用 户 和 通信 者 均 不 可 见 


7.8 无 线 和 移动 性 : 对 高 层 协 议 的 影响 


在 本 章 中 ,我 们 已 经 看 到 了 无 线 网 络 在 链 路 层 ( 由 于 无 线 信道 的 诸如 衰减 、 多 径 、 卫 
终端 等 特性 ) 和 网 络 层 〈 由 于 移动 用 户 改变 与 网 络 的 连接 点 ) 与 有 线 网 络 的 对 应 物 有 重 
大 的 区 别 。 但 在 运输 层 和 应 用 层 是 否 也 有 重大 差别 呢 ? 我 们 很 容易 认为 这 些 差别 是 很 小 
的 ， 因 为 在 有 线 和 无 线 网 络 中 的 网 络 层 均 为 上 层 提供 了 同样 的 尽力 而 为 服务 模式 。 类 似 
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地 ， 如 果 在 有 线 和 无 线 网 络 中 都 是 使 用 诸如 TCP 和 UDP 的 协议 提供 运输 层 服务 ， 那 么 应 
用 层 也 应 该 保持 不 变 。 在 某 个 方面 我 们 的 直觉 是 对 的 ， 即 TCP 和 UDP 可 以 (也 确实 ) 运 
行 在 具有 无 线 链 路 的 网 络 中 。 在 另 一 方面 ， 运 输 层 协议 (特别 是 TCP) 通常 在 有 线 和 无 线 
网 络 中 有 时 会 有 完全 不 同 的 性 能 。 这 里 ， 在 性 能 方面 区 别 是 明显 的 ， 我 们 来 研究 一 下 其 中 
的 原因 。 
前 面 讲 过 ， 在 发 送 方 和 接收 方 之 间 的 路 径 上 ， 一 个 报 文 段 不 论 是 丢失 还 是 出 错 ，TCP 
MABE. EBA MOE, BRAVES OAS (路 由 器 缓存 溢出 ) 或 者 切换 
(例如 ， 由 于 重 路 由 选择 报 文 段 到 移动 用 户 新 的 网 络 接 人 点 引入 的 时 延 ) 。 在 所 有 情况 下 ， 
TCP 的 接收 方 到 发 送 方 的 ACK 都 仅仅 表明 未 能 收 到 一 个 完整 的 报 文 段 ， 发 送 方 并 不 知道 
报 文 段 是 由 于 拥塞 ， 或 在 切换 过 程 中 ， 还 是 由 于 检测 到 比特 差错 而 被 丢弃 的 。 在 所 有 情况 
下 ， 发 送 方 的 反应 都 一 样 ， 即 重 传 该 报 文 段 。TCP 的 拥塞 控制 响应 在 所 有 场合 也 是 相同 
的 ， 即 TCP 减 小 其 拥塞 窗口 ， 如 3. 7 节 讨 论 的 那样 。 由 于 无 条 件 地 降低 其 拥塞 窗口 ，TCP 
隐 含 地 假设 报 文 段 丢失 是 由 于 拥塞 而 非 出错 或 者 切换 所 致 。 我 们 在 7. 2 节 看 到 ， 在 无 线 网 
络 中 比特 错误 比 在 有 线 网 络 中 普遍 得 多 。 当 这 样 的 比特 差错 或 者 切换 丢失 发 生 时 ， 没 理由 
ik TCP 发 送 方 降低 其 拥塞 窗口 (并 因此 降低 发 送 速 率 )。 此 时 路 由 器 的 缓存 的 确 可 能 完全 
是 空 的 ， 分 组 可 以 在 端 到 端 链 路 中 丝毫 不 受 拥塞 阻碍 地 流动 。 
研究 人 员 在 20 世纪 90 年 代 早期 到 中 期 就 认识 到 ， 由 于 无 线 信道 的 高 比特 差错 率 和 切 
EAM A REE, TCP 的 拥塞 控制 反应 在 无 线 情 况 下 可 能 会 有 问题 。 有 三 大 类 可 能 的 方法 
用 于 处 理 这 一 问题 : 
© 本 地 恢复 。 本 地 恢复 方法 的 目标 是 在 比特 差错 出 现 的 当时 和 当地 (如 在 无 线 链 路 
中 ) 将 其 恢复 。 如 在 7. 3 节 学 习 的 802. 11 ARQ 协议 ， 或 者 使 用 ARQ 和 FEC 的 更 
为 复杂 的 方法 | Ayanoglu 1995 |) 。 

e TCP 发送 方 知晓 无 线 链 路 。 在 本 地 恢复 方法 中 ，TCP 发 送 方 完 全 不 清楚 其 报 文 段 
跨越 一 段 无 线 链 路 。 另 一 种 方法 是 让 TCP 发 送 方 和 接收 方 知道 无 线 链 路 的 存在 ， 
从 而 将 在 有 线 网 络 中 发 生 的 拥塞 性 丢 包 和 在 无 线 网 络 中 发 生 的 差错 / 丢 包 区 分 开 ， 
并 且 仅 对 有 线 网 络 中 的 拥塞 性 丢 包 采用 拥塞 控制 。 在 假设 端 系统 能 够 做 出 这 种 区 
分 的 情况 下 ，| Balakrishnan 1997] 详细 研究 了 多 种 类 型 的 TCP。| Liu 2003] 研究 
了 在 一 个 端 到 端 路 径 中 区 分 有 线 部 分 丢 包 和 无 线 部 分 丢 包 的 技术 。 

© 分 离 连接 方法 。 在 分 离 连接 方法 中 [Bakre 1995], ， 移 动用 户 和 其 他 端点 之 间 的 端 
到 端 连 接 被 打 断 为 两 个 运输 层 连接 : 一 个 从 移动 主机 到 无 线 接 人 点 ， 一 个 从 无 线 
接 人 点 到 其 他 通信 端点 〈 我 们 假定 它 是 有 线 的 主机 ) 。 该 端 到 端 连接 因此 是 由 一 个 
无 线 部 分 和 一 个 有 线 部 分 级 连 形成 的 。 经 无 线段 的 运输 层 能 够 是 一 个 标准 的 TCP 
连接 [Bakre 1995 ] ,或 是 一 个 特别 定制 运行 在 UDP 上 的 差错 恢复 协议 。[ Yavatkar 
1994 ] 研究 了 经 无 线 连接 使 用 运输 层 选 择 性 重 传 协议 。 在 [Wei 2006) 中 的 测量 
报告 指出 了 分 离 TCP 连接 广泛 用 于 蜂 窒 数 据 网 络 中 ， 通 过 使 用 分 离 TCP 连接 ， 上 
述 问题 的 确 能 够 有 很 大 改进 。 

我 们 这 里 有 关 无 线 链 路 上 的 TCP 的 讨论 是 十 分 简要 的 。 在 无 线 网 络 中 有 关 TCP 挑战 
和 解决 方案 的 深入 展望 能 够 在 [ Hanabali 2005; Leung 2006] 中 找到 。 我 们 鼓励 读者 去 查 
阅 这 些 文献 以 了 解 这 个 正在 进行 的 研究 领域 的 详情 。 

考虑 过 运输 层 协 议 后 ， 我 们 接 下 来 考虑 无 线 和 移动 性 对 应 用 层 协 议 的 影响 。 这 里 一 个 
重要 的 考虑 是 无 线 链 路 经 常 具有 相对 较 低 的 带宽 ， 如 我 们 在 图 7-2 中 所 见 。 因 此 ， 运 行 在 
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无 线 链 路 尤其 是 蜂 帘 无 线 链 路 上 的 应 用 程序 ， 必 须 将 带宽 作为 稀有 物品 对 待 。 例 如 ， 一 个 
为 在 4G 电话 上 运行 的 Web 浏览 器 提供 服务 的 Web 服务 器 ， 就 不 能 像 为 运行 在 有 线 连接 的 
浏览 器 那样 提供 含有 大 量 图 片 的 内 容 。 尽 管 无 线 链 路 的 确 为 应 用 层 提 出 一 些 挑战 ， 它 们 具 
有 的 移动 性 同样 使 得 一 大 批 位 置 知 晓 和 环境 知晓 应 用 成 为 可 能 [ Chen 2000; Baldauf 
2007 ] 。 更 一 般 地 ， 无 线 和 移动 网 络 将 在 未 来 的 泛 在 计算 环境 实现 中 起 着 重要 作用 [ Weis- 
er 1991 ] 。 显 然 ， 在 谈 及 无 线 和 移动 网 络 对 网 络 应 用 及 其 协议 的 影响 时 ， 公 平 而 论 我 们 仅 
看 到 了 冰山 一 角 ! 


7.9 小 结 


无 线 网 络 和 移动 网 络 使 电话 发 生 了 革命 性 变化 ， 同 时 也 对 计算 机 网 络 界 产生 了 日 益 深 
远 的 影响 。 伴 随 着 它们 对 全 球 网 络 基础 设施 的 随时 、 随 地 、 无 缝 地 接 入 ,它们 不 仅 使 网 络 
接 入 变 得 更 加 无 所 不 在 ， 而 且 催 生 了 一 组 新 的 、 令 人 兴奋 的 位 置 相 关 服 务 。 考 虑 到 无 线 网 
络 和 移动 网 络 不 断 增 长 的 重要 性 ， 本 章 关 注 用 于 支持 无 线 和 移动 通信 的 原理 、 通 用 链 路 技 
术 以 及 网 络 体系 结构 。 

本 章 以 对 无 线 网 络 和 移动 网 络 的 介绍 开始 ， 描 述 了 由 这 种 网 络 中 通信 和 链 路 的 无 线 特性 
所 引发 的 挑战 和 由 这 些 无 线 链 路 带 来 的 移动 性 之 间 的 重要 区 别 。 这 使 我 们 能 够 更 好 地 区 
分 、 识 别 和 掌握 每 个 领域 中 的 关键 概念 。 我 们 首先 关注 无 线 通信 ， 在 7.2 市 中 考虑 了 无 线 
链 路 的 特征 。 在 7.3 节 和 7.4 节 中 ， 我们 研究 了 IEEE 802.11 (WiFi) 无 线 LAN 标准 、 两 
个 IEEE 802. 15 个 人 域 网 络 (蓝牙 和 ZigBee)， 以 及 3G 和 49G 蜂窝 因特网 接 入 。 然 后 我 们 
将 注意 力 转向 移动 性 问题 。 在 7.5 节 中 我 们 区 分 了 多 种 形式 的 移动 性 ， 不 同 的 移动 性 面临 
不 同 的 挑战 ， 并 且 看 到 了 不 同 的 解决 方案 。 我 们 考虑 了 移动 节点 的 定位 和 路 由 选择 问题 ， 
以 及 对 那些 动态 地 从 一 个 网 络 接 入 点 移 到 男 一 个 网 络 接 入 点 的 移动 用 户 的 切换 问题 。 在 
7.6 节 和 7.7 节 中 ,我们 分 别 考察 了 这 些 问题 在 移动 IP 标准 和 GSM 中 是 如 何 处 理 的 。 最 
后 ,我 们 在 7. 8 节 中 考虑 了 无 线 链 路 和 移动 性 对 运输 层 协 议和 网 络 应 用 的 影响 。 

尽管 我 们 用 了 整整 一 章 来 学 习 无 线 网 络 和 移动 网 络 ， 但 全 面 探索 这 个 令 人 兴奋 和 快速 
扩展 的 领域 需要 一 整 本 书 或 更 多 书 的 篇 幅 。 我 们 鼓励 读者 通过 查阅 在 本 章 中 提供 的 许多 参 
考 资 料 ， 对 这 一 领域 进行 更 深入 的 研究 。 
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7.1 节 

Rl. 一 个 无 线 网 络 运行 在 “基础 设施 模式 ”下 是 什么 含义 ? 如 果 某 网 络 没 有 运行 在 基础 设施 模式 下 ， 那 
么 它 运 行 在 什么 模式 下 ? 这 种 运行 模式 与 基础 设施 模式 之 间 有 什么 不 同 ? 

R2. 在 7.1 节 的 分 类 法 中 ， 所 确定 的 四 种 无 线 网 络 类 型 各 是 什么 ”你 已 经 使 用 的 是 这 些 无 线 网 络 类 型 中 
的 哪 一 种 ? 

7.2% 

R3. 下 列 类 型 的 无 线 信道 损伤 之 间 有 什么 区 别 : 路 径 损耗 、 多 径 传播 、 来 自 其 他 源 的 干扰 ? 

R4. 随 着 移动 节点 离开 基站 越 来 越 远 ， 为 了 保证 传送 帧 的 丢失 概率 不 增加 ， 基 站 能 够 采取 的 两 种 措施 是 
什么 ? 
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~7.4 节 
描述 802. 11 中 信和 标 帧 的 作用 。 
是 非 判 断 : 802. 11 站 在 传输 一 个 数据 帧 前 ， 必 须 首先 发 送 一 个 RTS 帧 并 收 到 一 个 对 应 的 CTS 帧 。 
为 什么 802. 11 中 使 用 了 确认 ， 而 有 线 以 太 网 中 却 未 使 用 ? 
是 非 判 断 : 以 太 网 和 802. 11 使 用 相同 的 帧 格式 。 
描述 RTS 门限 值 的 工作 过 程 。 
假设 IEEE 802. 11 RTS 和 CTS 帧 与 标准 的 DATA 和 ACK 帧 一 样 长 ， 使 用 CTS 和 RTS 帧 还 会 有 好 处 
吗 ? 为 什么 ? 
7.3.4 节 讨论 了 802. 11 移动 性 ， 其 中 无 线 站 点 从 一 个 BSS 到 同一 子 网 中 的 另 一 个 BSS。 当 AP 是 通 
过 交换 机 互 连 时 ， 为 了 让 交换 机 能 适当 地 转发 帧 ， 一 个 AP 可 能 需要 发 送 一 个 带 有 哄骗 的 MAC 地 址 
的 帧 ， 为 什么 ? 
在 某 蓝牙 网 络 中 的 一 个 主 设备 和 在 802. 11 网 络 中 的 一 个 基站 之 间 有 什么 不 同 ? 
在 802. 15.4 ZigBee 标准 中 超级 帧 的 含义 是 什么 ? 
在 3G 蜂窝 数据 体系 结构 中 ,“ 核 心 网 ”的 作用 是 什么 ? 
TE 3G 蜂 窗 数据 体系 结构 中 ，RNC 的 作用 是 什么 ?在 蜂窝 语音 网 中 RNC 起 什么 作用 ? 
在 4G 体系 结构 中 eNodeB、MME、P-GW 和 S-GW 的 作用 是 什么 ? 
3G 和 4G 蜂窝 体系 结构 之 间 的 3 个 重要 差别 是 什么 ? 
~7.6 节 
如 果 某 节点 与 因特网 具有 无 线 连接 ， 则 该 节点 必定 是 移动 的 吗 ? 试 解释 之 。 假 设 一 个 使 用 膝 上 型 电 
脑 的 用 户 携带 电脑 绕 着 她 的 住所 散步 ， 并 且 总 是 通过 相同 的 接 人 点 接 人 因特网 。 从 网 络 的 角度 看 ， 
这 是 移动 用 户 吗 ?” 试 解释 之 。 
永久 地 址 与 转交 地 址 之 间 的 区 别 是 什么 ? 谁 指派 转交 地 址 ? 
考虑 经 移动 IP 的 一 条 TCP 连接 。 是 非 判 断 : 在 通信 者 和 移动 主机 之 间 的 TCP 连接 阶段 经 过 该 移动 
用 户 的 归属 网 络 ， 但 数据 传输 阶段 直接 通过 该 通信 者 和 移动 主机 ， 绕 开 了 归属 网 络 。 
节 
在 GSM 网络 中 ，HLR 和 VLR 的 目的 是 什么 ”移动 IP 的 什么 要 素 类 似 于 HLR Al VLR? 
在 GSM 网 络 中 ， 锚 MSC 的 作用 是 什么 ? 
节 
为 了 避免 单一 无 线 链 路 降低 一 条 端 到 端 运输 层 TCP 连接 的 性 能 ， 能 够 采取 的 三 种 方法 是 什么 ? 


习题 


考虑 在 图 7-5 中 单一 发 送 方 的 CDMA 例子 。 如 果 发 送 方 的 CDMA 码 是 =i, ly hy ly wid 
1，-1) ， 那 么 其 输出 〈 对 于 所 显示 的 两 个 数据 比特 ) 是 什么 ? 


. 考虑 图 7-6 中 的 发 送 方 2， 发 送 方 对 信道 如 ,的 输出 是 什么 在 它 被 加 到 来 自发 送 方 1 的 信号 前 )? 
. 假设 在 图 7-6 中 的 接收 方 希望 接收 由 发 送 方 2 发 送 的 数据 。 说 明 通 过 使 用 发 送 方 2 的 代码 ，( 经 计 


算 ) 接收 方 的 确 能 够 将 发 送 方 2 的 数据 从 聚合 信道 信号 中 恢复 出 来 。 

在 两 个 发 送 方 、 两 个 接收 方 的 场合 ， 给 出 一 个 包括 1 和 -1 值 的 两 个 CDMA 编码 的 例子 ， 不 允许 两 个 

接收 方 从 两 个 CDMA 发 送 方 提取 出 初始 传输 的 比特 。 

假设 有 两 个 ISP 在 一 个 特定 的 咖啡 馆 内 提供 WiFi 接 人 ， 并 且 每 个 ISP 有 其 自己 的 AP A IP HH, 

a. 进一步 假设 ， 两 个 ISP 都 意外 地 将 其 AP 配置 运行 在 信道 11。 在 这 种 情况 下 ，802. 11 协议 是 否 将 
完全 月 演 ? 讨论 一 下 当 两 个 各 自 与 不 同 ISP 相关 联 的 站 点 试图 同时 传输 时 ， 将 会 发 生 什么 情况 。 

b. 现在 假设 一 个 AP 运行 在 信道 1， 而 另 一 个 运行 在 信道 11。 你 的 答案 将 会 有 什么 变化 ? 


. 在 CSMA/CA 协议 的 第 4 步 ， 一 个 成 功 传输 一 个 帧 的 站 点 在 第 2 步 〈 而 非 第 1 步 ) 开始 CSMA/CA 协 


议 。 通 过 不 让 这 样 一 个 站 点 立即 传输 第 2 个 帧 〈 如 果 侦 听 到 该 信道 空闲 ) , CSMA/CA 的 设计 者 是 基 
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于 怎样 的 基本 原理 来 考虑 的 呢 ? 

P7. 假设 一 个 802. 11b 站 点 被 配置 为 始终 使 用 RTS/CTS 序列 预约 信道 。 假 设 该 节点 突然 要 发 送 1000 字 节 
的 数据 ， 并 且 所 有 其 他 站 点 此 时 都 是 空闲 的 。 作 为 SIFS 和 DIFS 的 函数 ， 并 忽略 传播 时 延 ， 假 设 无 比 
特 差 错 ， 计 算 发 送 该 帧 和 收 到 确认 需要 的 时 间 。 

P8. 考虑 在 图 7-34 中 显示 的 情形 ， 其 中 有 4 个 无 线 节 点 A、B、C 和 D。 这 4 个 节点 的 无 线 电 覆 盖 范 围 显 
示 为 其 中 的 椭圆 形 阴 影 ， 所 有 节点 共享 相同 的 频率 。 当 A 传输 时 ， 仅 有 B 能 听 到 /接收 到 ; 4 B 传输 
时 ，A AIC 能 听 到 /接收 到 ; 当 C 传输 时 ，B 和 D 能 听 到 /接收 到 ; 当 D 传输 时 ， 仅 有 C 能 听 到 / 
接收 到 。 

假定 现在 每 个 节点 都 有 无 限 多 的 报 文 要 向 每 个 其 他 节点 发 送 。 如 果 一 个 报 文 的 目的 地 不 是 近邻 ， 

则 该 报 文 必须 要 中 继 。 例 如 ， 如 果 A 要 向 D BRK, HA A 的 报 文 必须 首先 发 往 B，B 再 将 该 报 文 发 

送 给 C，C 则 再 将 其 发 向 D。 时 间 是 分 隙 的 ， 报 文 所 用 的 传输 时 间 正 好 是 一 个 时 隙 ， 如 在 时 隙 Aloha 

中 的 情况 一 样 。 在 一 个 时 隙 中 ， 节 点 能 够 做 下 列 工作 之 一 : (i) 发 送 一 个 报 文 (如果 它 有 报 文 向 D 

转发 ) Gi) 接收 一 个 报 文 (如果 正好 一 个 报 文 要 向 它 发 送 ) (iii) 保持 静默 。 如 同 通常 情况 那样 ， 

如 果 一 个 节点 听 到 了 两 个 或 更 多 的 节点 同时 发 送 ， 出 现 冲突 ， 并 且 重 传 的 报 文 没 有 一 个 能 成 功 收 到 。 

你 这 时 能 够 假定 没有 比特 级 的 差错 ， 因 此 如 果 正 好 只 有 一 个 报 文 在 发 送 ， 它 将 被 位 于 发 送 方 传输 半 

径 之 内 的 站 点 正确 收 到 。 

a. 现在 假定 一 个 无 所 不 知 的 控制 器 〈 即 一 个 知道 在 网 络 中 每 个 节点 状态 的 控制 器 ) 能 够 命令 每 个 节 
点 去 做 它 〈 无 所 不 知 的 控制 器 ) 希望 做 的 事情 ， 例 如 发 送 报 文 ， 接 收报 文 ， 或 保持 静默 。 给 定 这 
种 无 所 不 知 的 控制 器 ， 数 据 报 文 能 够 从 C 到 A 传输 的 最 大 速率 是 什么 ， 假 定 在 任何 其 他 源 /目的 
地 对 之 间 没 有 其 他 报 文 ? 

. 现在 假定 A 向 B 发 送 报 文 ， 并 且 D 向 C 发 送 报 文 。 数 据 报 文 能 够 从 A BIB AMD 到 C 流动 的 组 

合 最 大 速率 是 多 少 ? 

c. 现在 假定 A 向 B 发 送 报 文 且 C 向 DD 发送 报 文 。 数 据 报 文 能 够 从 A 到 B 且 从 C 到 D 流动 的 组 合 最 
大 速率 是 多 少 ? 

d 现在 假定 无 线 链 路 由 有 线 链 路 代替 。 在 此 情况 下 ， 重 复 问 题 (a) ~ (ec) 。 

e 现在 假定 我 们 又 在 无 线 状态 下 ， 对 于 从 源 到 目的 地 的 每 个 数据 报 文 ， 目 的 地 将 向 源 回 送 一 个 ACK 
报 文 (例如 ， 如 同 在 TCP 中 ) 。 对 这 种 情况 重复 问题 (a) ~ (c). 
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图 7-34 习题 P8 的 情形 


P9. 描述 802. 15. 1 蓝牙 帧 的 格式 。 你 必须 要 阅读 某 些 课外 读物 来 获取 这 些 信息 。 在 帧 格式 中 有 哪些 因素 
本 质 上 会 限制 802. 15. 1 网 络 中 主动 节点 数量 为 8 R? 试 解释 之 。 

P10. 考虑 下 列 理想 化 的 LTE 情形 。 下 行 信道 (参见 图 7-21) 划分 为 时 辽 ， 使 用 了 下 个 频率 。 有 4 个 节 
点 A、B、C AID 分 别 以 10Mbps、5Mbps、2. 5Mbps 和 1Mbps 速率 在 下 行 信道 上 可 到 达 基 站 。 这 些 速 
率 假定 基本 在 所 有 F 个 频率 上 能 够 利用 所 有 时 际 只 向 一 个 站 点 进行 发 送 。 基 站 具有 无 限量 的 数据 向 
每 个 节点 发 送 ， 并 且 在 下 行 子 帧 中 的 任何 时 了 期间 使 用 下 个 频率 中 的 任何 之 一 能 够 向 这 4 个 站 点 之 
一 发 送 。 
a 假定 基站 在 每 个 时 隙 期 间 能 够 向 它 选 择 的 任何 节点 发 送 ， 它 能 向 节点 发 送 的 最 大 速率 是 多 少 ? 你 

的 解决 方案 公平 吗 ? 解释 并 定义 你 所 指 “ 公 平 ” 的 含义 。 

b 如 果 有 公平 要 求 ， 即 每 个 站 点 在 每 秒 期 间 必 须 收 到 等 量 的 数据 ， 在 下 行 子 帧 期 间 基站 (向 所 有 


P11. 


P12. 


P13. 


P14. 


P15. 


P16. 
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节点 ) 的 平均 传输 速率 是 多 少 ? 
。。 候 定 该 公平 性 准则 是 在 子 帧 期 间 任何 节点 至 多 能 够 接收 任何 其 他 节点 两 们 多 的 数据 。 在 下 行 子 相 
期 间 基 站 (向 所 有 节点 ) 的 平均 传输 速率 是 多 少 ? 解释 你 是 如 何 得 到 答案 的 。 
在 7.5 节 ， 一 种 允许 移动 用 户 在 外 部 网 络 间 移动 过 程 中 保持 其 IP 地 址 不 变 的 建议 方案 是 ， 让 外 部 网 
络 通告 一 个 到 该 移动 用 户 高 度 特定 的 路 由 ， 并 使 用 现 有 的 路 由 选择 基础 设施 在 整个 网 络 中 传播 这 一 
信息 。 我 们 将 扩展 性 作为 一 种 关注 因素 。 假 设 移动 用 户 从 一 个 网 络 移动 到 另 一 个 网 络 后 ， 新 的 外 部 
网 络 通告 一 个 到 移动 用 户 的 特定 路 由 ， 旧 的 外 部 网 络 丢 奔 其 路 由 。 考 虑 路 由 信息 如 何在 一 个 距离 回 
量 算 法 中 传播 (尤其 是 对 于 跨越 全 球 的 网 络 间 的 域 间 路 由 选择 情况 ) 。 
a. 一 且 外 部 网 络 开始 通告 其 路 由 ， 其 他 路 由 器 能 否 立 刻 将 数据 报 路 由 选择 到 新 的 外 部 网 络 呢 ? 
b. 不 同 的 路 由 器 有 可 能 认为 移动 用 户 位 于 不 同 的 外 部 网 络 中 吗 ? 
c. 讨论 网 络 中 其 他 路 由 器 最 终 知道 到 达 移 动用 户 的 路 径 所 用 的 时 间 范 围 。 
假设 图 7-23 中 通信 者 是 移动 的 。 概 述 为 了 将 数据 报 从 初始 移动 用 户 路 由 选择 到 (现在 移动 的 ) 通 
信者 所 需要 的 额外 的 网 络 层 基础 设施 。 如 图 7-24 中 那样 ， 显 示 在 初始 移动 用 户 和 (现在 移动 的 ) 
通信 者 之 间 数 据 报 的 结构 。 
在 移动 IP 中 ， 移 动 性 将 对 数据 报 在 源 和 目的 地 间 的 端 到 端 时 延 有 怎样 的 影响 ? 
考虑 7.7.2 节 最 后 讨论 的 链 的 例子 。 假 设 一 个 移动 用 户 访 问 外 部 网 络 A、B 和 C， 当 通信 者 在 外 部 
网 络 A 中 时 ， 它 开始 一 条 与 移动 用 户 的 连接 。 列 出 在 外 部 代理 之 间 和 外 部 代理 与 归属 代理 之 间 ， 当 
移动 用 户 从 网 络 A 到 网 络 B 再 到 网 络 C 的 过 程 中 的 报 文 序列 。 然 后 ， 假 设 未 执行 链接 ， 并 且 通 信者 
(以 及 归属 代理 ) 必须 被 显 式 地 告知 移动 用 户 转交 地 址 的 改变 。 列 出 在 第 二 种 情况 下 需要 交换 的 报 
文 序列 。 
考虑 在 一 个 具有 外 部 代理 的 外 部 网 络 中 的 两 个 移动 节点 。 在 移动 IP 中， 这 两 个 移动 节点 是 否 可 能 
使 用 相同 的 转交 地 址 ? 解释 你 的 答案 。 
在 我 们 对 VLR 如 何 用 移动 用 户 当前 位 置信 息 更 新 HLR 的 讨论 中 , 与 VLR 地 址 对 HLR 相 比 ， 提 供 
MSRN 所 具有 的 优 缺 点 各 是 什么 ? 


四 Wireshark 实验 


在 本 书 的 配套 Web 站 点 上 (http://www. pearsonhighered. com/cs- resources) ， 你 将 找到 有 关 本 章 的 一 


个 Wireshark 实验 ， 该 实验 用 于 捕获 和 学 习 在 无 线 便携 机 和 接 入 点 之 间 交 换 的 802. 11 帧 。 
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学 研究 院 (2007 年 ) 、 国 家 工程 院 (2009 年 ) 的 当选 成 员 ， 是 IEEE, ACM 和 AAAS HAH, 
她 被 选 为 首 名 ACM-W 雅典 娜 讲师 (2006 年 ) ， 获 得 Anita Borg 学 院 的 妇女 远见 创新 奖 (2007 
年 ), 被 引入 WITI 名 人 纪念 馆 (2008 年 ) ， 被 授予 EPFL (2008 年 ) 和 Uppsala 大 学 (2011 年 ) 
的 荣誉 博士 。 





384 RTF 


。 请 描述 您 职业 生涯 中 干 过 的 几 个 最 令 人 激动 的 项 目 ? 

20 世纪 90 年 代 中 期 当 我 在 USC 和 ISI 的 时 候 ， 非 常 荣 幸 地 与 像 Steve Deering, Mark Handley 和 Van 
Jacobson 这 样 的 人 物 在 一 起 工作 ,设计 多 播 路 由 选择 协议 (特别 是 PIM) 。 我 试图 将 多 播 体系 结构 设计 中 
的 许多 经 验 教训 借鉴 到 生态 监视 阵列 中 ， 这 是 我 首次 真正 开始 全 身心 地 进行 应 用 和 多 学 科 的 研究 。 那 让 
我 对 社会 和 技术 领域 中 的 联合 创新 感 兴趣 ， 它 们 激发 我 对 近期 的 研究 领域 一 一 移动 健康 的 研究 兴趣 。 这 
些 项 目 中 的 挑战 随 问题 领域 不 同 而 不 同 ， 但 它们 的 共同 之 处 是 需要 睁 大 我 们 的 眼睛 ， 当 我 们 在 设计 、 部 
署 、 制 作 原 型 和 试用 之 间 重 复 时 关注 对 问题 的 定义 是 否 正确 。 没 有 一 个 问题 能 够 借助 于 模拟 或 者 构造 的 
实验 室 实验 加 以 分 析 解 决 。 面 对 凌乱 的 问题 和 环境 要 保持 清晰 的 体系 结构 ,它们 都 对 我 们 的 能 力 提 出 挑 
战 ， 并 且 它 们 都 需要 广泛 的 协作 。 

© 未 来 在 无 线 网 络 和 移动 性 方面 您 预见 将 会 发 生 什 么 变化 和 创新 ? 

在 前 个 版 本 的 专访 中 曾 说 过 我 从 来 对 预测 未 来 不 具 太 多 信心 ,但 我 的 确 继续 推测 ， 随 着 智能 手机 变 
得 越 来 越 强 大 和 因特网 基本 接 人 点 增多 ， 我 们 可 能 看 到 特色 电话 〈 即 那些 不 可 编程 和 仅 能 用 于 语音 和 文 
本 信息 的 电话 ) 的 终结 ， 并 且 很 快 在 今天 这 个 推测 显然 已 经 成 真 。 我 也 认为 我 们 将 看 到 通信 式 SIM 的 继 
续 迅 速 增长 ， 各 种 设备 通过 艇 入 式 SIM 经 过 蜂窝 网 络 能 够 以 低 数据 率 通信 。 而 这 种 情况 已 出 现 ， 我 们 看 
到 许多 设备 和 “ 物 联网 ” ， 它 们 使 用 知人 式 WiFi 和 其 他 低 功 率 、 短 距离 以 及 各 种 形式 连接 到 本 地 中 心 。 
我 并 不 期 待 出 现 大 型 可 穿戴 消费 市 场 的 时 代 。 但 到 了 本 书 下 个 版 本 出 版 的 时 间 ， 我 期 待 着 在 物 联 网 和 其 
他 数字 设备 数据 的 促进 下 ， 个 人 应 用 软件 会 有 极 大 的 增长 。 

© 您 预见 网 络 和 因特网 未 来 将 往 何 处 发 展 ? 

我 仍然 认为 向 后 看 和 向 前 看 是 有 用 的 。 以 前 我 观察 到 在 命名 数据 和 软件 定义 网 络 方面 的 努力 将 出 现 
成 果 ， 产 生 更 可 管理 、 可 演化 和 更 丰富 的 基础 设施 ， 并 且 更 一 般 地 表现 为 推动 体系 结构 的 角色 向 协议 栈 
较 高 层 发 展 。 在 因特网 初期 时 ， 体 系 结构 包括 第 四 层 及 以 下 ,位 于 项 端的 应 用 程序 更 为 竖井 式 / 独 块 式 。 
现在 则 是 数据 和 分 析 控 制 着 传输 。SDN 的 采用 已 经 超出 了 我 一 直 以 来 的 预期 ， 在 本 书 的 第 7 版 中 包含 
SDN 的 内 容 使 我 由 衷 地 感到 高 兴 。 然 而 ， 从 协议 栈 向 上 看 去 ， 我 们 占 优 势 的 应 用 越 来 越 多 地 生存 在 带 围 
墙 的 花园 之 中 ， 无 论 是 移动 应 用 还 是 如 脸 书 那样 的 大 型 消费 者 平台 。 随 着 数据 科学 和 大 数据 技术 的 发 展 ， 
由 于 与 其 他 应 用 和 平台 连接 的 价值 ， 它 们 可 能 有 助 于 引导 这 些 应 用 跳出 藩 篇 。 

。 是 谁 激发 了 您 的 职业 灵感 ? 

有 三 个 人 出 现在 我 的 脑海 中 。 第 一 个 人 是 Dave Clark ， 他 是 因特网 界 的 秘方 和 无 名 英雄 。 早 期 我 有 幸 
在 他 的 左右 ， 看 到 他 在 IAB 的 组 织 规 范 和 因特网 管理 方法 方面 所 起 的 作用 ， 成 为 大 致 共识 和 运行 编码 的 
引导 者 。 第 二 个 人 是 Scott Shenker， 他 的 智慧 才华 、 正 直 和 坚持 令 我 印象 深刻 。 我 努力 却 很 难 像 他 那样 清 
晰 地 定义 问题 和 给 出 解决 方案 。 无 论 问 题 大 和 小 ， 我 发 电子 邮件 征求 建议 ， 他 总 是 第 一 个 回复 的 人 。 第 
三 个 人 是 我 的 姐姐 Judy Estrin， 她 将 创造 性 和 勇气 投入 到 她 的 职业 ， 将 想法 和 概念 带 入 市 场 。 没 有 
Judy 这 类 人 ， 因 特 网 技术 将 不 会 改变 我 们 的 生活 。 

e 您 对 进入 计算 机 科学 和 网 络 领域 的 学 生 有 什么 忠告 ? 

首先 ， 在 你 的 学 术 工 作 中 构建 一 个 坚实 的 基础 ， 与 你 能 够 得 到 的 任何 、 每 个 现实 世界 的 工作 经 验 相 
权衡 。 当 你 寻找 一 个 工作 环境 时 ， 在 你 真正 关心 的 问题 领域 寻找 机 会 ， 并 且 参 与 到 你 能 够 从 中 学 习 的 思 
维 敏捷 的 团队 中 。 
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计算 机 网 络 中 的 安全 





早 在 1.6 节 我 们 就 描述 了 某 些 非常 盛行 和 危险 的 因特网 攻击 ， 包 括 恶 意 软 件 攻 击 、 拒 
绝 服务 、 嗅 探 、 源 伪装 以 及 报 文 修改 和 删除 。 尽 管 我 们 已 经 学 习 了 有 关 计 算 机 网 络 的 大 量 
知识 ， 但 仍然 没有 考察 如 何 使 网 络 安全 ， 使 其 免 受 那些 攻击 的 威胁 。 在 获得 了 新 的 计算 机 
网 络 和 因特网 协议 的 专业 知识 后 ， 我 们 现在 将 深入 学 习 安 全 通信 ， 特 别 是 计算 机 网 络 能 够 
防御 那些 令 人 厌恶 的 坏 家 伙 的 原理 。 

我 们 首先 介绍 一 下 Alice 和 Bob， 这 俩 人 要 进行 通信 ， 并 希望 该 通信 过 程 是 “安全 ” 
的 。 由 于 本 书 是 一 本 网 络 教科 书 ， 因 此 Alice 和 Bob 可 以 是 两 台 需 要 安全 地 交换 路 由 选择 
表 的 路 由 器 ， 也 可 以 是 希望 建立 一 个 安全 传输 连接 的 客户 和 服务 器 ， 或 者 是 两 个 交换 安全 
电子 邮件 的 电子 邮件 应 用 程序 ， 所 有 这 些 学 习 案 例 都 是 在 本 章 后 面 我 们 要 考虑 的 。 总 之 ， 
Alice 和 Bob 是 安全 领域 中 两 个 众所周知 的 固定 设备 ， 也 许 因 为 使 用 Alice 和 Bob 更 为 有 
趣 ， 这 与 命名 为 “A” 的 普通 实体 需要 安全 地 与 命名 为 “B” 的 普通 实体 进行 通信 的 作用 
是 一 样 的 。 需 要 安全 通信 的 例子 通常 包括 不 正当 的 情人 关系 、 战 时 通信 和 商业 事务 往来 ; 
我 们 宁愿 用 第 一 个 例子 而 不 用 后 两 个 例子 ， 并 使 用 Alice 和 Bob 作为 发 送 方 和 接收 方 ， 以 
第 一 种 情况 为 背景 来 讨论 问题 。 

我 们 说 过 Alice 和 Bob 要 进行 通信 并 希望 做 到 “安全 ”， 那 么 此 处 的 安全 其 确切 含义 是 
什么 呢 ? 如 我 们 将 看 到 的 那样 ， 安 全 性 ( 像 爱 一 样 ) 是 多 姿 多 彩 的 东西 ; 也 就 是 说 ， 安 全 
性 有 许多 方面 。 训 无 疑问 ，Alice 和 Bob 和 布 望 他 们 之 间 的 通信 内 容 对 于 窃听 者 是 保密 的 。 
他 们 可 能 也 想 要 确保 当 他 们 进行 通信 时 ， 确 实 是 在 和 对 方 通信 ， 还 希望 如 果 他 们 之 间 的 通 
信和 被 窃听 者 算 改 ， 他 们 能 够 检测 到 该 通信 已 被 算 改 破坏 。 在 本 章 的 第 一 部 分 ， 我 们 将 讨论 
能 够 加 密 通 信 的 密码 技术 ， 鉴 别 正在 与 之 通信 的 对 方 并 确保 报 文 完整 性 。 

在 本 章 的 第 二 部 分 ， 我们 将 研究 基本 的 密码 学 原则 怎样 用 于 生成 安全 的 网 络 协议 。 我 
们 再 次 采用 自 顶 向 下 方法 ， 从 应 用 层 开始 ， 逐 层 ( 上面 四 层 ) 研究 安全 协议 。 我 们 将 研究 
如 何 加 密 电 子 邮 件 ， 如 何 加 密 一 条 TCP 连接 ， 如 何在 网 络 层 提供 覆盖 式 安全 性 ， 以 及 如 何 
使 无 线 LAN 安全 。 在 本 章 的 第 三 部 分 ， 我 们 将 考虑 运行 的 安全 性 ， 这 与 保护 机 构 网 络 免 
受 攻击 有 关 。 特 别 是 ， 我 们 将 仔细 观察 防火 墙 和 和信 侵 检测 系统 是 怎样 加 强 机 构 网 络 的 安全 
性 的 。 


8. 1 什么 是 网 络 安 全 


我 们 还 是 以 要 进行 “安全 ”通信 的 情人 Alice 和 Bob 为 例 ， 开 始 网 络 安全 的 研究 。 这 
确切 地 意味 着 什么 呢 ? 显然 ，Alice 布 望 即 使 他 们 在 一 个 不 安全 的 媒体 上 进行 通信 ， 也 只 
有 Bob 能 够 理解 她 所 发 送 的 报 文 ， 其 中 入 侵 者 (入侵 者 名 叫 Trudy) 能 够 在 该 媒体 上 截获 
从 Alice 向 Bob 传输 的 报 文 。Bob 也 需要 确保 从 Alice 接收 到 的 报 文 确实 是 由 Alice 所 发 送 
的 ， 并 且 Alice 要 确保 和 她 进行 通信 的 人 的 确 就 是 Bob。Alice 和 Bob 还 要 确保 他 们 报 文 的 
内 容 在 传输 过 程 中 没有 被 臭 改 。 他 们 首先 要 确信 人 能够 通信 ( 即 无 人 拒绝 他 们 接 入 通信 有 所 需 
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的 资源 ) 。 考 虑 了 这 些 问 题 后 ， 我 们 能 够 指出 安全 通信 (secure communication) 具有 下 列 
所 需要 的 特性 。 


机 密 性 〈confidentiality) 。 仅 有 发 送 方 和 和 厦 望 的 接收 方 能 够 理解 传输 报 文 的 内 容 。 
因为 神 听 者 可 以 截获 报 文 ， 这 必须 要 求 报 文 在 一 定 程 度 上 进行 加 密 (encrypted), 
使 截取 的 报 文 无 法 被 截获 者 所 理解 。 机 密 性 的 这 个 方面 大 概 就 是 通常 意义 上 对 于 
术语 安全 通信 的 理解 。 我 们 将 在 8. 2 节 中 学 习 数 据 加 密 和 解密 的 密码 学 技术 。 
报 文 完整 性 (message integrity), Alice 和 Bob 希望 确保 其 通信 的 内 容 在 传输 过 程 
中 未 被 改变 一 一 或 者 恶意 算 改 或 者 意外 改动 。 我 们 在 可 靠 传 输 和 数据 链 路 协议 中 
遇 到 的 检验 和 技术 在 扩展 后 能 够 用 于 提供 这 种 报 文 完整 性 ， 我 们 将 在 8.3 节 中 研 
究 该 主题 。 

端点 鉴别 (end-point authentication ) 。 发 送 方 和 接收 方 都 应 该 能 证 实 通信 过 程 所 涉及 
的 另 一 方 ， 以 确信 通信 的 另 一 方 确实 具有 其 所 声称 的 身份 。 人 类 的 面对面 通信 可 以 
通过 视觉 识别 轻易 地 解决 这 个 问题 。 当 通信 实体 在 不 能 看 到 对 方 的 媒体 上 交换 报 文 
时 ， 鉴 别 就 不 是 那么 简单 了 。 当 某 用 户 要 访问 一 个 邮箱 时 ， 邮 件 服务 器 如 何 证 实 该 
用 户 就 是 他 所 声称 的 那个 人 呢 ? 我 们 将 在 8. 4 节 中 学 习 端 点 鉴别 技术 。 

运行 安全 性 (operational security ) 。 几 乎 所 有 的 机 构 (公司 、 大 学 等 ) 今天 都 有 了 
与 公共 因特网 相连 接 的 网 络 。 这 些 网 络 都 因此 潜在 地 能 够 被 危及 安全 。 攻 击 者 能 
够 试图 在 网 络 主机 中 安放 蠕虫 ， 获 取 公 司 秘密 ， 勘 察 内 部 网 络 配置 并 发 起 DoS I 
击 。 我 们 将 在 8.9 节 中 看 到 诸如 防火 墙 和 入 侵 检 测 系 统 等 运行 设备 正 被 用 于 反 制 
对 机 构 网 络 的 攻击 。 防 火 墙 位 于 机 构 网 络 和 公共 网 络 之 间 ， 控 制 接 入 和 来 自 网 络 
的 分 组 。 入 侵 检 测 系 统 执行 “ 深 度 分 组 检查 ”任务 ， 问 网 络 管理 员 发 出 有 关 可 疑 
活动 的 和 警告。 





明确 了 我 们 所 指 的 网 络 安全 的 具体 含义 后 ， 接 下 来 考虑 入 侵 者 可 能 要 访问 的 到 底 是 哪 
些 信息 ， 以 及 入 侵 者 可 能 采取 哪些 行动 。 图 8-1 阐述 了 一 种 情况 。Alice (发 送 方 ) 想 要 发 
送 数 据 给 Bob (接收 方 )。 为 了 安全 地 交换 数据 ， 即 在 满足 机 密 性 、 端 点 鉴别 和 报 文 完整 
性 要 求 的 情况 下 ，Alice 和 Bob 交换 控制 报 文 和 数据 报 文 ( 以 非常 类 似 于 TCP 发 送 方 和 接 
收 方 双 方 交 换 控制 报 文 和 数据 报 文 的 方式 进行 )。 通 常 将 这 些 报 文 全 部 或 部 分 加 密 。 如 在 
1.6 节 所 讨论 的 那样 ， 入 侵 者 能 够 潜在 地 执行 下 列 行为 : 





窃听 一 一 监听 并 记录 信道 上 传输 的 控制 报 文 和 数据 报 文 。 
修改 、 插 入 或 删除 报 文 或 报 文 内 容 。 
数据 w 数据 





Alice 





图 8-1 发 送 方 、 接 收 方 和 入 侵 者 (Alice, Bob # Trudy) 


如 我 们 将 看 到 的 那样 ， 除 非 采取 适当 的 措施 ， 否 则 上 述 能 力 使 入 侵 者 可 以 用 多 种 方式 


HANA PIKE 387 


发 动 各 种 各 样 的 安全 攻击 : 客 听 通信 内 容 〈 可 能 家 取 口令 和 数据 ) ， 假 冒 另 一 个 实体 ， 
“劫持 ”一 个 正在 进行 的 会 话 ， 通 过 使 系统 资源 过 载 拒绝 合法 网 络 用 户 的 服务 请 求 等 等 。 
CERT 协调 中 心 对 已 报道 的 攻击 进行 了 总 结 [CERT 2016 | 。 

已 经 知道 在 因特网 中 某 处 的 确 存 在 真实 的 威胁 ， 则 Alice 和 Bob (两 个 需要 安全 通信 
的 朋友 ) 在 因特网 上 的 对 应 实体 是 什么 呢 ? 当然 ，Alice 和 Bob 可 以 是 位 于 两 个 端 系统 的 
人 类 用 户 ， 例 如， 真实 的 Alice 和 真实 的 Bob 真 的 需要 交换 安全 电子 邮件 。 他 们 也 可 以 参 
与 电子 商务 事务 。 例 如 ， 真 实 的 Bob 希望 安全 地 同一 台 Web 服务 器 传输 他 的 信用 卡号 码 ， 
以 在 线 购 买 商品 。 类 似 地 ， 真 实 的 Alice 要 与 银行 在 线 交 互 。 需 要 安全 通信 的 各 方 自身 也 
可 能 是 网 络 基础 设施 的 一 部 分 。 前 面 讲 过 ， 域 名 系统 (DNS, BL 2.4 节 ) 或 交换 路 由 选 
择 信 息 的 路 由 选择 守护 程序 (参见 第 5 章 ) 需要 在 两 方 之 间 安 全 通信 。 对 于 网 络 管理 应 用 
也 有 相同 的 情况 ,第 5 章 讨 论 了 该 主题 。 主 动 干扰 DNS 查找 和 更 新 (如 在 2.4 节 中 讨论 的 
那样 ) 、 路 由 选择 计算 [RFC 4272] 或 网 络 管理 功能 | RFC 3414] 的 人 侵 者 能 够 给 因特网 
造成 不 可 估量 的 破坏 。 

建立 了 上 述 框 架 ， 明确 了 一 些 重要 定义 以 及 网 络 安 全 需求 之 后 ， 我 们 将 深入 学 习 密 码 
学 。 应 用 密码 学 来 提供 机 密 性 是 不 言 而 喻 的 ， 同 时 我 们 很 快 将 看 到 它 对 于 提供 端点 鉴别 、 
报 文 完整 性 也 起 到 了 核心 作用 ， 这 使 得 密码 学 成 为 网 络 安全 的 基石 。 


8.2 密码 学 的 原则 


尽管 密码 学 的 漫长 历史 可 以 追溯 到 朱利叶 斯 :凯撒 (Julius Caesar) 时 代 ， 但 现代 密 
码 技术 〈 包 括 今天 的 因特网 中 正在 应 用 的 许多 技术 ) 基于 过 去 30 年 所 取得 的 进展 。Kahn 
的 著作 《破译 者 (The Codebreakers)) ( [Kahn 1967] 和 Singh 的 著作 《编码 技术 : 保密 
的 科学 一 一 从 古 埃 及 到 量子 密码 (The Code Book; The Science of Secrecy from Ancient Egypt 
to Quantum Cryptography) ) [Singh 1999] 回顾 了 引人入胜 的 密码 学 的 悠久 历史 。 对 密码 学 
的 全 面 讨论 需要 一 本 完整 的 书 [Kaufman 1995; Schneier 1995], ， 所 以 我 们 只 能 初步 了 解密 
人 码 学 的 基本 方面 ， 特 别 是 因为 这 些 东 西 正 在 今天 的 因特网 上 发 挥 作 用 。 我 们 也 注意 到 ， 尽 
管 本 市 的 重点 是 密码 学 在 机 密 性 方面 的 应 用 ， 但 我 们 将 很 快 看 到 密码 学 技术 与 鉴别 、 报 文 
完整 性 和 不 可 否认 性 等 是 紧密 相关 的 。 

密码 技术 使 得 发 送 方 可 以 伪装 数据 ， 使 人 侵 者 不 能 从 截取 到 的 数据 中 获得 任何 信息 。 
当然 ， 接 收 方 必 须 能 够 从 伪装 的 数据 中 恢复 出 初始 数据 。 图 8-2 说 明了 一 些 重要 的 术语 。 





图 8-2 ”密码 学 的 组 成 部 分 
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现在 假设 Alice Za Bob 发 送 一 个 报 文 。Alice 报 文 的 最 初 形式 (UN, “Bob, I love 
you. Alice”) 被 称 为 明文 (plaintext, cleartext), Alice 使 用 加 密 算法 (encryption algorithm) 
加 密 其 明文 报 文 ， 生 成 的 加 密 报 文 被 称 为 密 文 〈ciphertext) ， 该 密 文 对 任何 人 侵 者 看 起 来 
是 不 可 懂 的 。 有 趣 的 是 在 许多 现代 密码 系统 中 ， 包 括 因 特 网 上 所 使 用 的 那些 ， 加 密 技术 本 
上 身 是 已 知 的 ， 即 公开 发 行 的 、 标 准 化 的 和 任何 人 都 可 使 用 的 〈 例 如 [RFC 1321; RFC 
3447; RFC 2420; NIST 2001 ] ) ， 即 使 对 湾 在 的 入侵 者 也 是 如 此 ! 显然 ， 如 果 任 何人 都 知 
道 数 据 编码 的 方法 ， 则 一 定 有 一 些 秘密 信息 可 以 阻止 人 侵 者 解密 被 传输 的 数据 。 这 些 秘密 
信息 就 是 密 钥 。 

在 图 8-2 H, Alice 提供 了 一 个 密 钥 (key) KK ， 它 是 一 串 数 字 或 字符 ， 作 为 加 密 算法 的 
输入 。 加 密 算法 以 密 钥 和 明文 报 文 m 为 输入 ， 生 成 的 密 文 作为 输出 。 用 符号 Ky (m) 表示 
(使 用 密 钥 K, 加 密 的 ) 明文 报 文 m 的 密 文 形式 。 使 用 密 钥 K, 的 实际 加 密 算 法 显然 与 上 下 文 
有 关 。 类 似 地 ，Bob 将 为 解密 算法 (decryption algorithm) 提供 密 钥 Ks， 将 密 文 和 Bob 的 密 
钥 作 为 输入 ， 输 出 初始 明文 。 也 就 是 说 ， 如 果 Bob 接收 到 一 个 加 密 的 报 文 K(m)， 他 可 通过 
计算 K,(K,(m) ) =m 进行 解密 。 在 对 称 密 钥 系统 (symmetric key system) P, Alice 和 Bob 
的 密 钥 是 相同 的 并 且 是 秘密 的 。 在 公开 密 钥 系统 (public key system， 也 称 为 公 钥 系统 ) P, 
使 用 一 对 密 钥 : 一 个 密 钥 为 Bob 和 Alice 癸 人 所 知 (实际 上 为 全 世界 所 知 )， 男 一 个 密 钥 只 有 
Bob 或 Alice 知道 ( 而 不 是 双方 都 知道 )。 在 下 面 两 小 节 中 ， 我们 将 更 为 详细 地 考虑 对 称 密 钥 
系统 和 公 钥 系统 。 


8.2.1 对 称 密 钥 密码 体制 


所 有 密码 算法 都 涉及 用 一 种 东西 替换 男 一 种 东西 的 思想 ， 例 如 ， 取 明文 的 一 部 分 进行 
计算 ， 替换 适 当 的 密 文 以 生成 加 密 的 报 文 。 在 分 析 现 代 基 于 密 钥 的 密码 系统 之 前 ， 我 们 首 
先 学 习 一 下 凯撒 《密码 (Caesar cipher) 找 找 感觉 ， 这 是 一 种 加 密 数 据 的 方法 。 这 种 非常 古 
老 而 简单 的 对 称 密 钥 算法 由 Julius Caesar 发 明 。 

凯撒 密码 用 于 英语 文本 时 ， 将 明文 报 文 中 的 每 个 字母 用 字母 表 中 该 字母 后 第 上 个 字母 
进行 替换 〈 人 允许 回 绕 ， 即 把 字母 “a” 排 在 字母 “z” 之 后 ) 。 例 如 ， 如 果 丰 =3， 则 明文 中 
的 字母 “a” 变 成 密 文 中 的 字母 “d”; 明文 中 的 字母 “b” 变 成 密 文中 的 字母 “e”， 依 此 
类 推 。 因 此 , 的 值 就 作为 密 钥 。 举 一 个 例子 ， 明 文 报 文 “bob，i love you. alice” 在 密 文 
HARM “ere, | oryh brx. dolfh”。 尽 管 密 文 看 起 来 像 乱 码 ， 但 如 果 你 知道 使 用 了 凯撒 密码 
加 密 ， 因 为 密 钥 值 只 有 25 个， 所 以 用 不 了 多 久 就 可 以 破解 它 。 

凯撒 密码 的 一 种 改进 方法 是 单 码 代替 密码 ( monoalphabetic cipher) ， 也 是 使 用 字母 表 中 
的 一 个 字母 替换 该 字母 表 中 的 另 一 个 字母 。 然 而 ， 并 非 按照 规则 的 模式 进行 替换 (例如 ， 明 
文中 的 所 有 字母 都 用 偏 移 量 为 k 的 字母 进行 替换 )， 只 要 每 个 字母 都 有 一 个 唯一 的 蔡 换 字母 ， 
任 一 字母 都 可 用 男 一 字母 替换 ， 反 之 亦 然 。 图 8-3 为 加 密 明 文 的 一 种 可 行 替换 规则 。 


图 8-3 单 码 代 蔡 密码 
明文 报 文 “bob，i love you. alice” 变 成 “nkn，s gktc wky. mgsbe”。 因 此 ， 与 用 凯撒 密 
码 情况 一 样 ， 这 看 起 来 像 乱码 。 单 码 代替 密码 的 性 能 看 来 要 比 凤 撒 密 但 的 性 能 好 得 多 ， 可 
能 的 字母 配对 为 26! (10” 数 量 级 ) 种 ， 而 不 是 25 种。 尝试 所 有 10” 种 可 能 配对 的 蛮 力 法 
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要 求 的 工作 量 太 大 ， 不 是 一 种 破解 加 密 算 法 和 解密 报 文 的 可 行 方式 。 但 是 ， 通 过 对 明文 语 
言 进行 统计 分 析 ， 例 如 ， 在 典型 的 英语 文本 中 ， 由 于 已 知 字 母 “e” 和 字母 “t ”出 现 的 频 
率 较 高 (这 些 字母 出 现 的 频率 分 别 为 13% 和 9% ) ， 并 且 常 见 的 两 三 个 字母 的 组 合 通常 一 
起 出 现 〈 例 如 , “in” “it” “the” “ion” “ing” 等 等 ) ， 这 就 使 得 破解 该 密 文 变 得 相对 容 
易 。 如 果 入 侵 者 具有 某 些 该 报 文 的 可 能 内 容 的 知识 ， 则 破解 该 密码 就 会 更 为 容易 。 例 如 ， 
如 果 入 侵 者 Trudy 是 Bob 的 妻子 ,怀疑 Bob 和 Alice 有 了 暧昧 关系 ， 则 她 猜想 “bob” 和 
“alice” 这 些 名 字 可 能 会 出 现在 密 文中 。 如 果 Trudy 确信 这 两 个 名 字 出 现在 密 文中 ， 并 有 
了 上 述 报 文 的 密 文 副 本 ， 则 她 能 够 立即 决定 这 26 个 字母 配对 中 的 7 个 ， 比 蛮 力 法 少 检查 
10 种 可 能 性 。 如 果 Trudy 的 确 怀疑 Bob 有 不 正当 的 男女 关系 ， 她 可 能 也 非常 期 待 从 该 报 
文中 找到 某 些 其 他 选择 的 词汇 。 
当 考 虑 Trudy 破解 Bob 和 Alice 之 间 加 密 方案 的 难 易 程 度 时 ， 可 以 根据 人 侵 者 所 拥有 
的 信息 分 为 三 种 不 同 的 情况 。 
。 唯 密 广 攻击。 有些 情况 下 ， 和 人 侵 者 只 能 得 到 截取 的 密 文 ， 也 不 了 解 明文 报 文 的 内 容 。 
我 们 已 经 看 到 ， 统 计 分 析 有 助 于 对 加 蜜 方案 的 唯 密 文 攻击 (ciphertext- only attack ) 。 
e 已 知 明文 攻击 。 前 面 已 经 看 到 ， 如 果 Trudy 以 某 种 方式 确信 在 密 文 报 文中 会 出 现 
“bob” 和 “alice”， 她 就 可 以 确定 字母 a、1、i、c、e、b 和 0o 的 (明文 ， 密 文 ) 
匹配 关系 。Trudy 也 可 能 会 幸运 地 记录 到 传输 的 所 有 密 文 ， 然 后 在 一 张 纸 上 找到 
Bob 写 下 的 已 解密 的 明文 。 当 入 侵 者 知道 (明文 ， 密 文 ) 的 一 些 匹 配 时 ， 我 们 将 
其 称 为 对 加 密 方案 的 已 知 明 文 攻击 (known-plaintext attack ) 。 
o 选择 明文 攻击 。 在 选择 明文 攻击 (chosen-plaintext attack) 中 ， 和 信 侵 者 能 够 选择 某 
一 明文 报 文 并 得 到 该 明文 报 文 对 应 的 密 文 形式 。 对 于 我 们 前 面 所 说 的 简单 加 密 算 
法 来 说 ， 如 果 Trudy 能 让 Alice 发 送 报 文 “The quick brown fox jumps over the lazy 
dog”, M) Trudy 就 能 够 完全 破解 Alice 和 Bob 所 使 用 的 加 密 方 案 。 但 是 随后 我 们 将 
看 到 ， 对 于 更 为 复杂 的 加 密 技术 来 说 ， 使 用 选择 明文 攻击 不 一 定 意 味 着 能 够 攻破 
该 加 密 机 制 。 
500 年 前 ， 发 明了 多 码 代替 密码 ( polyalphabetic encryption) ， 这 种 技术 是 对 单 码 代替 密 
码 的 改进 。 多 码 代替 密码 的 基本 思想 是 使 用 多 个 单 码 代替 密码 ， 一 个 单 码 代替 密码 用 于 加 密 
某 明 文 报 文中 一 个 特定 位 置 的 字母 。 因 此 ， 在 某 明文 报 文中 不 同位 置 出 现 的 相同 字母 可 能 以 
不 同 的 方式 编码 。 图 8-4 中 显示 了 多 码 代 蔡 密 码 机 制 的 一 个 例子 。 它 使 用 两 个 凯撒 密码 (其 
中 k=5 和 k=19)， 如 图 中 不 同 的 行 所 示 。 我 们 可 以 选择 使 用 这 两 个 凯撒 密码 C, 和 C,， 加 密 
时 采用 以 C, CG, CG, Ci, CG 的 次 序 循环 的 模式 ， 即 明文 的 第 一 个 字母 用 C, 编码 ， 第 二 和 
第 三 个 字母 用 Cy 编码 ， 第 四 个 字母 用 C, 编码 ， 第 五 个 字母 用 Cy 编码 ， 然后 循环 重复 该 模 
Fy MTP C AS, BET TRER C eS, KEANE 这 样 一 来 ， 明 文 报 文 
“bob, i love you. ”加 密 后 成 为 “ghu，n etox dhz. ” 。 注 意 到 明文 报 文中 的 第 一 个 “b” 用 C， 
INRA “g, BZA “b” ACG 加 密 为 “u”。 在 这 个 例子 中 ， 加 密 和 解密 “ 密 钥 ”是 两 个 
凯撒 密码 密 钥 (k=5 和 k=19) MC, C, C, C, C 的 次 序 模式 的 知识 。 


C, (k=5) : 于 aiin A ha te baa oA D A 
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图 8-4 使 用 两 个 凯撒 密码 的 多 码 代 蔡 密 码 
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1. 块 密码 

我 们 现在 回 到 现代 社会 中 ， 考 察 对 称 密 钥 加 密 今天 的 工作 方式 。 对 称 加 密 技 术 有 两 种 
宽泛 的 类 型 : 流 密码 (stream cipher) 和 块 密码 (block cipher) 。 当 我 们 研究 无 线 LAN 的 
安全 性 时 ， 将 在 8.7 节 中 简要 地 研究 流 密码 。 在 本 节 中 ， 我 们 关注 块 密码 ， 该 密码 用 在 多 
种 因特网 协议 的 加 密 中 ， 包 括 PGP (用 于 安全 电子 邮件 ) SSL (用 于 使 TCP 连接 更 安全 ) 
和 IPsec (用 于 使 网 络 层 传 输 更 安全 )。 

在 块 密码 中 ， 要 加 密 的 报 文 被 处 理 为 k 比特 的 块 。 例 如 ， 如 果 上 =64， 则 报 文 被 划分 
为 64 比特 的 块 ， 每 块 被 独立 加 密 。 为 了 加 密 一 个 块 ， 该 密码 采用 了 一 对 一 映射 ， 将 上 比 
特 块 的 明文 映射 为 上 比特 块 的 密 文 。 我 们 来 看 一 个 例子 。 假 设 k=3， 因 此 块 密码 将 3 比特 
WA (HX) 映射 为 3 比特 输出 ( 密 文 )。 表 8-1 给 出 了 一 种 可 能 的 映射 。 注 意 到 这 是 一 
个 一 对 一 的 映射 ， 即 对 每 种 输入 有 不 同 的 输出 。 这 种 块 密码 将 报 文 划分 成 3 比特 的 块 并 根 
据 映 射 关系 进行 加 密 。 可 以 验证 ， 报 文 010110001111 被 加 密 成 了 101000111001 。 


表 8-1 一 种 特定 的 3 比特 块 密码 
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继续 这 个 3 比特 块 的 例子 ， 注 意 到 上 述 映 射 只 是 许多 可 能 映射 中 的 一 种 。 有 多 少 种 可 
能 的 映射 呢 ? 要 回答 这 个 问题 ， 观 察 到 一 个 映射 只 不 过 是 所 有 可 能 输入 的 排列 。 共 有 
2( =8) 种 可 能 的 输入 (排列 在 “输入 ” 栏 中 )。 这 8 种 输入 能 够 排列 为 8! =40 320 种 不 
同方 式 。 因 为 这 些 排列 的 每 种 都 定义 了 一 种 映射 ,共有 40 320 种 可 能 的 映射 。 我 们 能 够 将 
这 些 映射 的 每 种 视 为 一 个 密 钥 ， 即 如 果 Alice 和 Bob 都 知道 该 映射 〈 密 钥 ) ， 他 们 能 够 加 密 
和 解密 在 他 们 之 间 发 送 的 报 文 。 

对 这 种 密码 的 蛮 力 攻击 即 通过 使 用 所 有 映射 来 尝试 解密 密 文 。 仅 使 用 40 320 种 映射 
( 当 上 =3) ， 这 能 够 在 一 台 桌 面 PC 上 迅速 完成 。 为 了 挫败 蛮 力 攻击 ， 块 密码 通常 使 用 大 得 
多 的 块 ， 由 64 比特 甚至 更 多 比特 组 成 。 注 意 到 对 于 通常 的 上 比特 块 密码 ， 可 能 映射 数量 
是 2 !， 对 于 即使 不 大 的 上 值 (如 k=64)， 这 也 是 一 个 天 文 数字 。 

如 刚才 所 述 ， 尽 管 全 表 块 密码 对 于 不 大 的 大 值 能 够 产生 健壮 的 对 称 密 钥 加 密 方案 ， 但 
不 幸 的 是 它们 难以 实现 。 对 于 =64 和 给 定 的 映射 ， 将 要 求 Alice 和 Bob 维护 一 张 具 有 2” 
个 输入 值 的 表 ， 这 是 一 个 难以 实现 的 任务 。 此 外 ， 如 果 Alice 和 Bob 要 改变 密 钥 ,他 们 将 
不 得 不 每 人 重新 生成 该 表 。 因 此 ， 全 表 块 密码 在 所 有 输入 和 输出 之 间 提 供 了 预先 决定 的 映 
射 (如 在 上 述 例子 中 那样 )， 这 简直 是 不 可 能 实现 的 事 。 

取而代之 的 是 ， 块 密码 通常 使 用 函数 模拟 随机 排列 表 。 在 图 8-5 中 显示 了 当 k =64 时 
这 种 函数 的 一 个 例子 〈 引 上 自 [Kaufman 1995 ] ) 。 该 函数 首先 将 64 比特 块 划分 为 8 个 块 ， 
每 个 块 由 8 比特 组 成 。 每 个 8 比特 块 由 一 个 “8 比特 到 8 比特 ” 表 处 理 ， 这 是 个 可 管理 的 
长 度 。 例 如 ， 第 一 个 块 由 标志 为 T 的 表 来 处 理 。 接 下 来 ， 这 8 个 输出 块 被 重新 装配 成 一 
个 64 比特 的 块 。 该 输出 被 回馈 到 64 比特 的 输入 ， 开 始 了 第 二 次 循环 。 经 n 次 这 样 的 循环 
后 ， 该 函数 提供 了 一 个 64 比特 的 密 文 块 。 这 种 循环 的 目的 是 使 得 每 个 输入 比特 影响 最 后 
输出 比特 的 大 部 分 ( 即使 不 是 全 部 )。( 如果 仅 使 用 一 次 循环 ， 一 个 给 定 的 输入 比特 将 仅 
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影响 64 输出 比特 中 的 8 比特 。) 这 种 块 密码 算法 的 密 钥 将 是 8 张 排 列表 (假定 置 乱 函数 是 
公共 已 知 的 ) 。 





图 8-5 一 个 块 密码 的 例子 


目前 有 一 些 流行 的 块 密码 ， 包 括 DES (Data Encryption Standard， 数 据 加 密 标准 )、 
3DES 和 AES ( Advanced Encryption Standard， 高 级 加 密 标 准 )。 这 些 标 准 都 使 用 了 函数 
( 而 不 是 预先 决定 的 表 ) ， 连 同 图 8-5 的 线 (虽然 对 每 种 密码 来 说 更 为 复杂 和 具体 )。 这 些 
算法 也 都 使 用 了 比特 串 作 为 密 钥 。 例 如 ，DES 使 用 了 具有 56 比特 密 钥 的 64 比特 块 。AES 
使 用 128 比特 块 ， 能 够 使 用 128 192 和 256 比特 长 的 密 钥 进行 操作 。 一 个 算法 的 密 钥 决 
定 了 特定 “小 型 表 ” 了 映射 和 该 算法 内 部 的 排列 。 对 这 些 密码 进行 蛮 力 攻击 要 循环 通过 所 有 
密 铀 ， 用 每 个 密 钥 应 用 解密 算法 。 观 察 到 采用 长 度 为 的 密 铀 ， 有 2" 种 可 能 的 密 钥 。 
NIST [NIST 2001] 估计 ， 如 果 用 1 秒 破解 56 比特 DES 的 计算 机 〈 就 是 说 ， 每 秒 尝试 所 有 
2 个 密 钥 ) 来 破解 一 个 128 比特 的 AES 密 钥 ， 要 用 大 约 149 万 亿 年 的 时 间 才 有 可 能 成 功 。 

2. 密码 块 链接 


在 计算 机 网 络 应 用 中 ， 通 常 需要 加 密 长 报 文 (或 长 数据 流 )。 如 果 使 用 前 面 描述 的 块 
密码 ， 通 过 直接 将 报 文 切割 成 k 比特 块 并 独立 地 加 密 每 块 ， 将 出 现 一 个 微妙 而 重要 的 问 
题 。 为 了 理解 这 个 问题 ， 注 意 到 两 个 或 更 多 个 明文 块 可 能 是 相同 的 。 例 如 ， 两 个 或 更 多 块 
中 的 明文 可 能 是 “HTTP/1. 1”。 对 于 这 些 相同 的 块 ， 块 密码 当然 将 产生 相同 的 密 文 。 当 攻 
击 者 看 到 相同 的 密 文 块 时 ， 它 可 能 潜在 地 猜 出 其 明文 ， 并 且 通 过 识别 相同 的 密 文 块 和 利用 
支撑 协议 结构 的 知识 ， 甚 至 能 够 解密 整个 报 文 [Kaufman 1995 ] 。 

为 了 解决 这 个 问题 ， 可 以 在 密 文 中 混合 某 些 随机 性 ， 使 得 相同 的 明文 块 产生 不 同 的 密 
文 块 。 为 了 解释 这 个 想法 , Smi) 表示 第 i 个 明文 块 ，c(i) 表示 第 i 个 密 文 块 ， 并且 
a 由 /表示 两 个 比特 串 a Ab 的 异 或 (XOR)。【( 前 面 讲 过 0 中 0=1 昌 1=0 和 0 名 1= 
1 由 0=1, 并 且 两 个 比特 串 的 异 或 是 逐 位 进行 的 。 例 如 10101010 ®© 11110000 =01011010, ) 
另外 ， 将 具有 密 钥 $ 的 块 密码 加 密 算法 表示 为 K;。 其 基本 思想 如 下 : 发 送 方 为 第 i 块 生 成 
一 个 随机 的 比特 数 r(i) ， 并 且 计 算 c(i) =Ks(m(i) 电 7(i) )。 注 意 到 每 块 选择 一 个 新 的 上 
比特 随机 数 。 则 发 送 方 发 送 c(1)、r(1)、c(2)、r(2)、c(3) 和 rr(3) 等 等 。 因 为 接收 方 
接收 到 c(i) 和 7r(i)， 它 能 够 通过 计算 m(i) =K.(c(i)Or(i)) 而 恢复 每 个 明文 块 。 重 要 
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的 是 注意 到 下 列 事 实 : 尽管 r(i) 是 以 明文 发 送 的 ， 并 且 因 此 能 被 Trudy IRIRE, 1B Wh IC 
法 获得 明文 m(i) ， 因 为 她 不 知道 密 钥 K;。 同 时 注意 到 如 果 两 个 明文 块 m(i) 和 m(]) 是 相 
同 的 ， 对 应 的 密 文 块 c(i) Me) 将 是 不 同 的 (只 要 随机 数 r(i) 和 r(i) 不 同 ,， 这 种 情况 
出 现 的 概率 将 很 高 ) 。 

举例 来 说 ， 考 虑 表 8-1 中 的 3 比特 块 密码 。 假 设 明 文 是 010010010。 如 果 Alice 直接 对 
此 加 密 ， 没 有 包括 随机 性 ， 得 到 的 密 文 变 为 101101101。 如 果 Trudy WR BIZ AIC, AA 
这 三 个 密 文 块 都 是 相同 的 ， 她 能 够 正确 地 推 新 出 这 三 个 明文 块 都 是 相同 的 。 现 在 假设 Al- 
ice 产生 了 随机 块 r(1) =001、r(2) =111 和 r(3) =100, 并 且 使 用 了 上 述 技术 来 生成 密 文 c 
(1) =100、c(2) =010 和 c(3) =000。 注 意 到 即使 明文 块 相同 ， 三 个 密 文 块 也 是 不 同 的 。 
Alice WAGE c(1)、r(1)、c(2) 和 7r(2)。 读 者 可 证 实 Bob 能 够 使 用 共享 的 密 钥 KK, 获得 初 
始 的 明文 。 

精明 的 读者 将 注意 到 ， 引 入 随机 性 解决 了 一 个 问题 而 产生 了 另 一 个 问题 : Alice 必 
须 传输 以 前 两 倍 的 比特 。 实 际 上 ， 对 每 个 加 密 比 特 ， 她 现在 必须 再 发 送 一 个 随机 比特 ， 
使 需要 的 带宽 加 倍 。 为 了 有 效 利 用 该 技术 ， 块 密码 通常 使 用 了 一 种 称 为 密码 块 链接 
(Cipher Block Chaining, CBC) 的 技术 。 其 基本 思想 是 仅 随 第 一 个 报 文 发 送 一 个 随机 值 ， 
然后 让 发 送 方 和 接收 方 使 用 计算 的 编码 块 代 替 后 继 的 随机 数 。 有 具体 而 言 ，CBC 运行 过 程 
如 下 : 

1) 在 加 密 报 文 (或 数据 流 ) 之 前 ,发送 方 生 成 一 个 随机 的 上 比特 串 ， 称 为 初始 向 量 
(Initialization Vector，IV ) 。 将 该 初始 回 量 表示 为 c(0)。 发 送 方 以 明文 方式 将 IV 发 送 给 接 
收 方 。 

2) 对 第 一 个 块 ， 发 送 方 计算 m(1) 电 c(0)， 即 计算 第 一 块 明文 与 IV 的 异 或 。 然 后 通 
过 块 密码 算法 运行 得 到 的 结果 以 得 到 对 应 的 密 文 块 ， 即 c(1) =K;(m(1) 电 c(0))。 发 送 方 
[ta] FHMC Ty ALIA TN BH IR c(1)。 

3) 对 于 第 i 个 块 ， 发 送 方 根据 c(i) =Ks(m(i) Be(i-1)) 生成 第 i 个 密 文 块 。 

我 们 现在 来 考察 这 种 方法 的 某 些 后 果 。 首 先 ， 接 收 方 将 仍 能 够 恢复 初始 报 文 。 训 无 疑 
问 ， 当 接收 方 接收 到 c(i) AY, CH Ky 解密 之 以 获得 s(i) =m(i)Oc(i-1); 因为 接收 方 
已 经 知道 c(i-1)， 则 从 m(i) =s(i)BWe(i-1) 获得 明文 块 。 第 二 ， 即 使 两 个 明文 块 是 相 
同 的 ， 相 应 的 密 文 块 也 (几乎 ) 总 是 不 同 的 。 第 三 ， 虽然 发 送 方 以 明文 发 送 IV, ARE 
将 仍 不 能 解密 密 文 块 ， 因 为 该 入 侵 者 不 知道 秘密 密 钥 S。 最 后 ， 发 送 方 仅 发 送 一 个 最 前 面 
的 块 ( 即 IV)， 因 此 对 (由 数 百 块 组 成 的 ) 长 报 文 而 言 增加 的 市 宽 用 量 微 不 足 道 。 

举例 来 说 ， 对 表 8-1 中 的 3 比特 块 密码 ， 明 文 为 010010010 和 IV =c(0) =001， 我 们 现在 
来 确定 其 密 文 。 发 送 方 首先 使 用 IV 来 计算 c(1) =K (m(1)®c(0)) =100。 发 送 方 然后 计 
算 c(2) =Ks(m(2)@®c(1)) =K,(010 由 100) =000, 并 且 c(3) =K,(m(3)@c(2)) = 
K,(010 @ 000) =101。 读 者 可 证 实 接收 方 右 知 道 了 IV 和 Ks;， 将 能 够 恢复 初始 的 明文 。 

当 设计 安全 网 络 协议 时 ，CBC 有 一 种 重要 的 后 果 : 需要 在 协议 中 提供 一 种 机 制 ， 以 从 
发 送 方向 接收 方 分 发 IV。 在 本 草 稍 后 我 们 将 看 到 几 个 协议 是 如 何 这 样 做 的 。 


8. 2.2 公开 密 钥 加 密 


从 凯撒 密码 时 代 直 到 20 世纪 70 年 代 的 两 千 多 年 以 来 ， 加 密 通信 都 需要 通信 双方 共享 
一 个 共同 秘密 ， 即 用 于 加 密 和 解密 的 对 称 密 钥 。 这 种 方法 的 一 个 困难 是 两 方 必须 就 共享 密 
钥 达成 一 致 ， 但 是 这 样 做 的 前 提 是 需要 通信 (可 假定 是 安全 的 )! 可 能 是 双方 首先 会 面 ， 
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人 为 协商 确定 密 钥 〈( 例 如， 凯撒 的 两 个 百 夫 长 在 罗马 浴室 碰头 ) ， 此 后 才能 进行 加 密 通 信 。 
但 是 ， 在 网 络 世 界 中 ， 通 信 各 方 之 间 可 能 从 未 见 过 面 ， 也 不 会 在 网 络 以 外 的 任何 地 方 交 
谈 。 此 时 通信 双方 能 够 在 没有 预先 商定 的 共享 密 钥 的 条 件 下 进行 加 密 通 信 吗 ? 1976 年 ， 
Diffie 和 Hellman | Diffie 1976] 论证 了 一 个 解决 这 个 问题 的 算法 (MWERA Diffie- Hellman 
密 钥 交换 ) ， 这 是 个 完全 不 同 、 极 为 优雅 的 安全 通信 算法 ， 开 创 了 如 今 的 公开 密 钥 密码 系 
统 的 发 展 之 路 。 我 们 很 快 就 会 看 到 公开 密 钥 密码 系统 也 有 许多 很 好 的 特性 ， 使 得 它 不 仅 可 
以 用 于 加 密 ， 还 可 以 用 于 鉴别 和 数字 签名 。 有 趣 的 是 ， 最 近 发 现 20 世纪 70 年 代 早 期 由 英 
国 通信 电子 安全 团体 的 研究 人 员 独 立 研究 的 一 系列 秘密 报告 中 的 思想 ， 与 [Diffie 1976 | 
和 [RSA 1978] 中 的 思想 类 似 [ Ellis 1987 ] 。 事 实 和 常常 如 此 ， 伟 大 的 想法 通常 会 在 许多 地 
方 独立 地 闪现 ; 幸运 的 是 ， 公 钥 的 进展 不 仅 秘密 地 发 生 ， 而 且 也 在 公众 视野 中 发 生 。 

公开 密 钥 密 码 的 使 用 在 概念 上 相当 简单 。 假 设 Alice 要 和 Bob 通信 。 如 图 8-6 fray, 
这 时 Alice 和 Bob 并 未 共享 一 个 密 钥 (如 同 在 对 称 密 钥 系统 情况 下 ) ， 而 Bob (Alice 报 文 
的 接收 方 ) 则 有 两 个 密 钥 ， 一 个 是 世界 上 任何 人 (包括 人 侵 者 Trudy) 都 可 得 到 的 公 角 
(public key) ， 另 一 个 是 只 有 Bob 知道 的 私 钥 (private key) 。 我 们 使 用 符号 Ky 和 Ks 来 分 
别 表 示 Bob 的 公 钥 和 私 钥 。 为 了 与 Bob 通信 ，Alice 首先 取得 Bob 的 公 钥 ， 然 后 用 这 个 公 
铀 和 一 个 众所周知 的 〈 例 如 ， 已 标准 化 的 ) 加 密 算 法 ， 加 密 她 要 传递 给 Bob 的 报 文 m; 即 
Alice 计算 Ks (m) Bob 接收 到 Alice 的 加 密 报 文 后 ， 用 其 私 钥 和 一 个 众所周知 的 (例如 ， 
已 标准 化 的 ) 解密 算法 解密 Alice 的 加 密 报 文 ， 即 Bob 计算 Ks (Ky (m) )。 后 面 我 们 将 看 
到 ， 存 在 着 可 以 选择 公 钥 和 私 钥 的 加 密 / 解 密 算法 和 技术 ,使 得 Ks (Ks (m)) =m; 也 就 是 
说 ， 用 Bob 的 公 钥 Ki 加 密 报 文 m (得 到 Ki (m)), ， 然 后 再 用 Bob 的 私 钥 K 解密 报 文 的 
密 文 形式 (就 是 计算 Ks (Ks (m) ) ) 就 能 得 到 最 初 的 明文 m。 这 是 个 不 寻常 的 结果 ! 用 这 
种 办 法 ，Alice 可 以 使 用 Bob 公开 可 用 的 密 钥 给 Bob 发 送 机 密 信息 ， 而 他 们 任 一 方 都 无 须 
分 发 任何 密 钥 ! 我 们 很 快 能 够 看 到 ， 公 和 钥 和 私 钥 加 密 相互 交换 同样 能 够 得 到 不 寻常 的 结 
AL, BI Ks (Ks (m)) =K; (Ks (m)) =m, 
Or K5 公 开 加 密 密 钥 
O K, AREA 





明文 报 文 n | | 明文 报 文 m 


m=K; (Ki, (m)) 





图 8-6 公开 密 钥 密码 


因此 公开 密 钥 密 码 体 制 的 使 用 在 概念 上 是 简单 的 。 但 是 有 两 点 必须 要 注意 。 首 先 应 关 
注 的 是 ， 尽 管 人 侵 者 截取 到 Alice 的 加 密 报 文 时 看 到 的 只 是 乱码 ， 但 是 入 侵 者 知道 公 钥 
(显然 Bob 的 公 钥 是 全 世界 都 可 以 使 用 的 ) 和 Alice 加 密 所 用 的 算法 。Trudy 可 以 据 此 发 起 
选择 明文 攻击 ， 使 用 已 知 的 标准 加 密 算法 和 Bob 的 公开 可 用 的 加 密 密 钥 对 她 所 选择 的 任意 
报 文 编码 ! 例如 ，Trudy 可 以 尝试 对 她 怀疑 Alice 可 能 发 送 的 全 部 报 文 或 部 分 报 文 编码 。 很 
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明显 ， 要 使 公开 密 钥 密码 能 工作 ， 密 钥 选 择 和 加 密 /解密 算法 必须 保证 任意 和 人 侵 者 都 不 能 
(至 少 要 困难 得 几乎 不 可 能 ) 确定 出 Bob 的 私 钥 或 者 以 某 种 方式 解密 或 猜 出 Alice 发 给 Bob 
的 报 文 。 第 二 个 值得 关注 的 问题 是 ， 既 然 Bob 的 加 密 密 钥 是 公开 的 ， 任 何人 (包括 Alice 
和 其 他 声称 自己 是 Alice 的 人 ) 都 可 能 向 Bob 发 送 一 个 已 加 密 的 报 文 。 在 单一 共享 密 钥 情 
况 下 ， 发 送 方 知道 共享 秘密 密 钥 的 事实 就 已 经 向 接收 方 隐 含 地 证 实 了 发 送 方 的 身份 。 然 而 
在 公 钥 体制 中 ， 这 点 就 行 不 通 了 ， 因 为 任何 一 个 人 都 可 回 Bob 发 送 使 用 Bob 的 公开 可 用 密 
钥 加 密 的 报 文 。 这 就 需要 用 数字 签名 把 发 送 方 和 报 文 绑 定 起 来 ， 数 字 签 名 是 我 们 在 8. 3 节 
中 讨论 的 主题 。 
1. RSA 


尽管 可 能 有 许多 算法 处 理 这 些 关 注 的 问题 , 但 RSA 算法 (RSA algorithm， 取 算法 创 
立 人 Ron Rivest, Adi Shamir 和 Leonard Adleman 的 首 字 母 命名 ) 几乎 已 经 成 了 公开 密 钥 密 
码 的 代名词 。 我 们 首先 来 理解 RSA 是 如 何 工 作 的 ， 然 后 再 考察 RSA 的 工作 原理 。 

RSA 广泛 地 使 用 了 模 nn 算 术 的 算术 运算 。 故 我 们 简要 地 回顾 一 下 模 算 术 。 前 面 讲 过 六 
mod n 只 是 表示 被 n 除 时 x 的 余数 ; 因此 如 19 mod 5 =4。 在 模 算术 中 ， 人 们 执行 通常 的 加 
法 、 乘 法 和 指数 运算 。 然 而 ， 每 个 运算 的 结果 由 整数 余数 代 蔡 ， 该 余数 是 被 n 除 后 留 下 的 
数 。 对 于 模 算 术 的 加 法 和 乘法 可 由 下 列 便 于 施用 的 事实 所 简化 : 

[ (a mod n) + (b mod n) |mod n= (a + 6)mod n 

| (a mod n) — (b mod n) |mod n= (a — b)mod n 

[ (a mod n) + (b mod n) |mod n= (a+ b)mod n 
从 第 三 个 事实 推出 (a mod n)’ mod n=a* mod n， 我 们 很 快 将 会 发 现 这 个 恒等式 是 非常 有 
用 的 。 

现在 假设 Alice 要 向 Bob 发 送 一 个 RSA 加 密 的 报 文 ， 如 图 8-6 所 示 。 在 我 们 的 讨论 中 ， 
心中 永远 要 记 住 一 个 报 文 只 不 过 是 一 种 比特 模式 ， 并 且 所 有 比特 模式 能 唯一 地 被 一 个 整数 
(连同 该 比特 模式 的 长 度 ) 表示 。 例 如 ， 假 设 一 个 报 文 是 比特 模式 1001; 这 个 报 文 能 由 十 
进 制 整数 9 来 表示 。 所 以 ， 当 用 RSA 加 密 一 个 报 文 时 ， 等 价 于 加 密 表 示 该 报 文 的 这 个 唯一 
的 整数 。 

RSA 有 两 个 互相 关联 的 部 分 : 

© 公 钥 和 私 钥 的 选择 。 

© 加 密 和 解密 算法 。 

为 了 生成 RSA 的 公 钥 和 私 钥 ，Bob 执行 如 下 步骤 : 

1) 选择 两 个 大 素数 p 和 9。 那 么 p 和 g 应 该 多 大 呢 ? 该 值 越 大 ， 破 解 RSA 越 困难 ， 
而 执行 加 密 和 解密 所 用 的 时 间 也 越 长 。RSA 实验 室 推荐 ， 公 司 使 用 时 ，P 和 gq 的 乘积 为 
1024 比特 的 数量 级 。 对 于 选择 大 素数 的 方法 的 讨论 ， 参 见 [Caldwell 2012 ] 。 

2) 计算 mn=pg 和 z=(pP-1)(9-1)。 

3) 选择 小 于 nn 的 一 个 数 e， 且 使 e 和 zz 没有 ( 非 1 的 ) 公 因 数 。 (这 时 称 e 与 z 互 
素 。) 使 用 字母 e RMA AX MAK OA TI o 

4) 求 一 个 数 d， 使 得 ed -1 可 以 被 z 整除 (就 是 说 ,没有 余数 )。 使 用 字母 d 表示 是 
因为 这 个 值 将 用 于 解密 。 换 句 话 说 ， 给 定 e， 我 们 选择 4d， 使 得 

ed modz = | 


5) Bob 使 外 界 可 用 的 公 钥 Kj 是 一 对 数 (n, e), HAGA Ks 是 一 对 数 (n, d)o 
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Alice 执行 的 加 密 和 Bob 进行 的 解密 过 程 如 下 : 
o 假设 Alice 要 给 Bob 发 送 一 个 由 整数 m 表示 的 比特 组 合 ， 且 m <n。 为 了 进行 编码 ， 
Alice 执行 指数 运算 m, RAWA m 被 n 除 的 整数 余数 。 换 言 之 ，Alice 的 明文 报 
X m 的 加 密 值 c 就 是 : 
c=m modn 
对 应 于 这 个 密 文 c 的 比特 模式 发 送 给 Bob, 
o 为 了 对 收 到 的 密 文 报 文 c 解密 ，Bob 计算 : 
m = c mod n 
这 要 求 使 用 他 的 私 钥 (n, d)o 
举 一 个 简单 的 RSA 例子 ,假设 Bob 选择 p =5 和 g =7。( 坦 率 地 讲 ， 这样 小 的 值 无 法 
保证 安全 。) 则 n=35 和 z=24。 因 为 5 和 24 没有 公 因 数 ， 所 以 Bob 选择 e =5。 最 后 ， 因 
WS x29-1 ( 即 ed -1) 可 以 被 24 整除 ， 所 以 Bob 选择 d=29。Bob 公 开 了 n=35 和 e=5 
这 两 个 值 ， 并 秘密 保存 了 d =29。 观 察 公 开 的 这 两 个 值 ， 假 定 Alice HEEF “I “o” 
“v” 和 “e” 给 Bob。 用 1~26 之 间 的 每 个 数 表示 一 个 字母 ， 其 中 1 表示 “a”,…，26 表 
示 “z”，Alice 和 Bob 分 别 执行 如 表 8-2 和 表 8-3 所 示 的 加 密 和 解密 运算 。 注 意 到 在 这 个 例 
子 中 ， 我 们 认为 每 四 个 字母 作为 一 个 不 同 报 文 。 一 个 更 为 真实 的 例子 是 把 这 四 个 字母 转换 
成 它们 的 8 比特 ASCII 表示 形式 ， 然 后 加 密 与 得 到 的 32 比特 的 比特 模式 对 应 的 整数 。( 这 
样 一 个 真实 的 例子 产生 了 一 些 长 得 难以 在 教科 书 中 打印 出 来 的 数 !) 


表 8-2 ee eee e=5, N=35 


msa | messa [Taken 


3 8-3 Bob hy RSA E, d=29, n=35 
Exe | O" | mmn | 明文 字母 


17 481968572106750915091411825223071697 1 
15 12783403948858939111232757568359375 
22 851643319086537701956194499721106030592 | 

| | ; 


10 100000000000000000000000000000 


假定 表 8-2 MK 8-3 中 的 简单 示例 已 经 产生 了 某 些 极 大 的 数 ， 并 且 假 定 我 们 前 面 看 到 
p Allg 都 是 数 百 比特 长 的 数 ， 这 些 都 是 实际 使 用 RSA 时 必须 要 牢记 的 。 如 何 选择 大 素数 ? 
如 何 选择 。 和 d? 如 何 对 大 数 进行 指数 运算 ? 对 这 些 重 要 问题 的 详细 讨论 超出 了 本 书 的 范 
围 ， 详 情 请 参见 | Kaufman 1995] 以 及 其 中 的 参考 文献 。 

2. SBA 

这 里 我 们 注意 到 ，RSA 所 要 求 的 指数 运算 是 相当 耗费 时 间 的 过 程 。 形 成 对 比 的 是 ， 
DES 用 软件 实现 要 比 RSA 快 100 倍 ， 用 硬件 实现 则 要 快 1000 ~ 10 000 f} [RSA Fast 
2012] 。 所 以 ， 在 实际 应 用 中 ，RSA 通常 与 对 称 密 钥 密 码 结合 起 来 使 用 。 例 如 ， 如 果 Alice 
Zaj Bob 发 送 大 量 的 加 密 数 据 ， 她 可 以 用 下 述 方式 来 做 。 首 先 ，Alice 选择 一 个 用 于 加 密 
数据 本 身 的 密 铀 ， 这 个 密 钥 有 时 称 为 会 话 密 钥 (session key)， 该 会 话 密 钥 表示 为 Kso 
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Alice 必须 把 这 个 会 话 密 钥 告知 Bob， 因 为 这 是 他 们 在 对 称 密 钥 密码 (如 DES Bk AES) 中 
所 使 用 的 共享 对 称 密 钥 。Alice 可 以 使 用 Bob 的 RSA 公 钥 来 加 密 该 会 话 密 钥 ， 即 计算 c = 
(Ks)“ mod n, Bob 收 到 了 该 RSA 加 密 的 会 话 密 钥 c 后 ， 解 密 得 到 会 话 密 钥 K,。Bob 此 时 已 
经 知道 Alice 将 要 用 于 加 密 数 据 传输 的 会 话 密 钥 了 。 

3. RSA 的 工作 原理 

RSA 加 密 / 解 密 看 起 来 相当 神奇 。 为 什么 那样 应 用 加 密 算 法 ， 然 后 再 运行 解密 算法 ， 
就 能 恢复 出 初始 报 文 呢 ? 要 理解 RSA 的 工作 原理 ,我 们 仍 将 记 n =pq, HP p A q 是 RSA 
算法 中 的 大 素数 。 

前 面 讲 过 ， 在 RSA 加 密 过 程 中 ， 一 个 报 文 m (唯一 地 表示 为 整数 ) ER n ERM e 
rie, B 

c = m modn 

解密 则 先 对 该 值 执行 d KRZR, 再 做 模 n 运算 。 因 此 先 加 密 再 解密 的 结果 是 (m 
mod n) mod n。 下 面 我 们 来 看 关于 这 个 量 能 够 得 到 什么 。 正 如 前 面 提 到 的 ， 模 算术 的 一 个 
重要 性 质 是 对 于 任意 值 a、n 和 d 都 有 (a mod n)" mod n=a" mod n。 因 此 ， 在 这 个 性 质 中 
使 用 a =m ， 则 有 

(m° mod n) mod n = m“ mod n 

因此 剩 下 证 明 m” mod n =m。 尽 管 我 们 正 试图 揭 开 RSA 工作 原理 的 神秘 面纱 ， 但 为 了 
做 到 这 一 点 ， 我 们 还 需要 用 到 数论 中 一 个 相当 神奇 的 结果 。 具 体 而 言 ， 就 是 要 用 到 数论 中 
这 样 的 结论 : 如 果 p 和 g BAM, 且 有 n=pg 和 z=(p-1)(g-1), Wx mod n 5 x? ™? 
mod n 是 等 同 的 【 Kaufman 1995 ] 。 应 用 这 个 结论 ， 对 于 x =m 和 y =ed， 可 得 


(ed mod =) 


m“ mod n = m mod n 
但 是 要 记 住 ,我 们 是 这 样 选择 e Fld HY, Bled mod z=1。 这 告诉 我 们 
m“ modn=m modn=m 
这 正 是 我 们 希望 得 到 的 结果 ! 先 对 m 做 e KEZA (加 密 ) 再 做 d KREZA (M 
密 ) ， 然 后 做 模 n 的 算术 运算 (原文 中 没有 这 句 ， 译 者 认为 有 必要 补 上 。 一 一 译 者 注 )， 
就 可 得 到 初始 的 兽 。 甚 至 更 为 奇妙 之 处 是 这 样 一 个 事实 ， 如 果 我 们 先 对 普 做 4 次 才 运 算 
(加 密 ) 再 做 e 次 项 运算 ， 即 颠倒 加 密 和 人 解密 的 次 序 ， 先 执行 解密 操作 再 执行 加 密 操作 ， 
也 能 得 到 初始 值 m。 这 个 奇妙 的 结果 完全 遵循 下 列 模 算术 : 
(m* mod mn) mod n = m“ mod n = m“ mod n = (m’ mod n)“ mod n 
RSA 的 安全 性 依赖 于 这 样 的 事实 : 目前 没有 已 知 的 算法 可 以 快速 进行 一 个 数 的 因数 分 
解 ， 这 种 情况 下 公开 值 无 法 快速 分 解 成 素数 p 和 9g。 如 果 已 知 p 和 4949， 则 给 定 公 开 值 e， 
就 很 容易 计算 出 秘密 密 钥 4。 另 一 方面 ， 不 确定 是 否 存 在 因数 分 解 一 个 数 的 快速 算法 ， 从 
这 种 意义 上 来 说 ，RSA 的 安全 性 也 不 是 确保 的 。 
另 一 种 流行 的 公 钥 加 密 算 法 是 Diffie- Hellman， 我 们 将 在 课 后 习题 中 简要 探讨 它 。 
Diffie- Hellman 并 不 像 RSA 那样 多 功能 ， 即 它 不 能 用 于 加 密 任意 长 度 的 报 文 ; 然而 ， 它 能 
够 用 来 创建 一 个 对 称 的 会 话 密 钥 ， 该 密 钥 再 被 用 于 加 密 长 报 文 。 


8.3 报 文 完整 性 和 数字 签名 


在 前 面 一 节 中 我 们 看 到 了 能 够 使 用 加 密 为 两 个 通信 实体 提供 机 密 性 。 在 本 节 中 我 们 转 
向 提供 报 文 完 整 性 (message integrity) 这 个 同等 重要 的 主题 。 报 文 完 整 性 也 称 为 报 文 鉴 
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别 。 连 同 报 文 完整 性 ， 在 本 节 中 我 们 将 讨论 两 个 相关 的 主题 : 数字 签名 和 端点 鉴别 。 

我 们 再 次 使 用 Alice 和 Bob 来 定义 报 文 完 整 性 问题 。 假 定 Bob 接收 到 一 个 报 文 (这 可 
能 已 经 加 密 或 可 能 是 明文 ) ， 并 且 他 认为 这 个 报 文 是 由 Alice 发 送 的 。 为 了 鉴别 这 个 报 文 ， 
Bob 需要 证 实 : 

1) 该 报 文 的 确 源 目 Alice。 

2) 该 报 文 在 到 Bob 的 途中 没有 被 臭 改 。 

我 们 将 在 8.4 ~8.7 节 中 看 到 ， 报 文 完整 性 这 个 问题 在 所 有 安全 网 络 协议 中 都 是 至 关 
重要 的 。 

举 一 个 特定 的 例子 ， 考 虑 一 个 使 用 链 路 状态 路 由 选择 算法 (例如 OSPF) 的 计算 机 网 
络 ， 在 该 网 络 中 决定 每 对 路 由 需 之 间 的 路 由 〈 参 见 第 5 章 )。 在 一 个 链 路 状态 算法 中 ， 每 
台 路 由 器 需要 向 该 网 络 中 的 所 有 其 他 路 由 器 广播 一 个 链 路 状态 报 文 。 路 由 器 的 链 路 状态 报 
文 包 括 直 接 相 连 邻 居 的 列表 以 及 到 这 些 邻 居 的 直接 费用 。 一 旦 某 台 路 由 器 从 其 他 所 有 路 由 
帮 收 到 了 链 路 状态 报 文 ， 它 能 够 生成 该 网 络 的 全 图 ， 运 行 它 的 最 小 费用 路 由 选择 算法 并 配 
置 它 的 转发 表 。 对 路 由 选择 算法 的 一 个 相对 容易 的 攻击 是 ，Trudy 分 发 具有 不 正确 状态 信 
息 的 虚假 链 路 状态 报 文 。 因 此 产生 了 报 文 完整 性 的 需求 : 当 路 由 器 B 收 到 来 自 路 由 器 A 的 
链 路 状态 报 文 时 ， 路 由 器 B 应 当 证 实 路 由 右 A 实际 生成 了 该 报 文 ， 并 且 进 一 步 证 实在 传输 
过 程 中 该 报 文 没有 被 自 改 。 

在 本 节 中 ， 我 们 描述 一 种 由 许多 安全 网 络 协 议 所 使 用 的 流行 报 文 完整 性 技术 。 但 在 做 
此 事 之 前 ， 我 们 需要 涉及 密码 学 中 的 态 一 个 重要 主题 ， 即 密码 散 列 函数 。 


8.3.1 密码 散 列 函数 


如 图 8-7 FEIR, AIRRA m 为 输入 ， 并 计算 得 到 一 个 称 为 散 列 的 固定 长 度 的 字符 串 
H(m), 。 因 特 网 检验 和 (第 3 章 ) 和 CRC (第 6 章 ) 都 满足 这 个 定义 。 密 码 散 列 函 数 
(cryptographic hash function) 要 求 具 有 下 列 附 加 的 性 质 : 

© 找到 任意 两 个 不 同 的 报 文 * 和 y 使 得 H(x) =H(y)， 在 计算 上 是 不 可 能 的 。 

不 严格 地 说 ， 这 种 性 质 就 意味 着 入 侵 者 在 计算 上 不 可 能 用 其 他 报 文 蔡 换 由 散 列 函数 保 
护 的 报 文 。 这 就 是 说 ， 如 果 (m，H(m)) 是 报 文 和 由 发 送 方 生成 的 报 文 散 列 的 话 ， 则 和 人 
侵 者 不 可 能 伪造 另 一 个 报 文 y 的 内 容 ， 使 得 该 报 文具 有 与 原 报 文 相 同 的 散 列 值 。 





图 8-7 散 列 函数 
我 们 来 证 实 一 个 简单 的 检验 和 ( 如 因特网 检验 和 ) 只 能 算 作 劣质 的 密码 散 列 函数 。 不 
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像 在 因特网 检验 和 中 执行 反 码 运算 那样 ， 我 们 把 每 个 字符 看 作 一 个 字 节 ， 并 把 这 些 字 节 加 
到 一 起 ， 一 次 用 4 字 节 的 块 来 进行 计算 。 假 定 Bob X Alice 100. 99 美元 并 且 向 Alice 发 送 一 
张 借据 ， 这 个 借据 包含 文本 字符 串 “I0U100. 99BOB”。 这 些 字 符 的 ASCII 表示 (以 十 六 进 
制 形 式 ) 449, 4F, 55, 31, 30, 30, 2E, 39, 39, 42, 4F, 42, 

8-8 上 半 部 分 显示 了 这 个 报 文 的 4 字 节 检验 和 是 B2 C1 D2 AC, Kl 8-8 下 半 部 分 显 
示 了 一 条 稍微 不 同 的 报 文 (但 是 Bob 要 付 的 钱 却 多 了 许多 ) 。 报 文 “IO0U100.99BOB” 和 
“IOU900. 19BOB” 有 相同 的 检验 和 。 因 此 ， 这 种 简单 的 检验 和 算法 违反 了 上 述 要 求 。 给 定 
初始 数据 ， 很 容易 找到 有 相同 检验 和 的 另 一 组 数据 。 很 明显 ， 为 了 安全 起 见 ， 我 们 需要 比 
检验 和 更 为 强 有 力 的 散 列 函数 。 





ASCII AR 
Ron Rivest | RFC 1321] AY MDS 散 列 算法 
如 今 正在 广泛 使 用 。 这 个 算法 通过 4 步 过 程 计 aa ee 
算得 到 128 比特 的 散 列 。 这 4 步 过 程 由 下 列 步 42 4F 
又 组 成 : 中 填充 一 一 先 填 1， 然后 填 足 够 多 的 C1 D2 
0, 直到 报 文 长 度 满足 一 定 的 条 件 ; OR 
加 一 一 在 填充 前 添加 一 个 用 64 比特 表示 的 报 ASCI[ 表 示 
文 长 度 ; @ 初 始 化 累加 器 ; 由 循环 在 最 后 | 
的 循环 步骤 中 ， 对 报 文 的 16 字 块 进行 4 轮 处 42 4F 


理 。MD5 的 描述 (包括 一 个 C 源 代 码 实现 ) cl p2 

Ay BAHL | RFC 1321], steak 
目前 正 使 用 的 第 二 个 主要 散 列 算法 是 安全 图 8-8 初始 报 文 和 欺诈 报 文 具有 相同 的 检验 和 

散 列 算法 SHA-1 (Security Hash Algorithm) [ FIPS 1995 ]。 这 个 算法 的 原理 类 似 于 MD4 

[RFC 1320] 设计 中 所 使 用 的 原理 ， 而 MD4 是 MDS 的 前 身 。SHA-1 是 美国 联邦 政府 的 标 

ME, 任何 联 邦 政府 的 应 用 程序 如 果 需 要 使 用 密码 散 列 算法 的 话 ， 都 要 求 使 用 SHA-1。SHA- 

1 生成 一 个 160 比特 的 报 文摘 要 。 较 长 的 输出 长 度 可 使 SHA-1 更 安全 。 


8.3.2 报 文 鉴别 码 


我 们 现在 再 回 到 报 文 完 整 性 的 问题 。 既 然 我 们 理解 了 散 列 函数 ， 就 先 来 看 一 下 将 如 何 
执行 报 文 完整 性 : 

1) Alice 生成 报 文 m 并 计算 散 列 Hm) (例如 使 用 SHA-1)。 

2) 然后 Alice 将 H(m) 附加 到 报 文 m 上 ， 生 成 一 个 扩展 报 文 (m，H(m))， 并 将 该 
扩展 报 文 发 给 Bob。 

3) Bob 接收 到 一 个 扩展 报 文 (m, h) 并 计算 H(m), WR H(m) =h, Bob 得 到 结 
w: -WEM 

这 种 方法 存在 明显 缺陷 。Trudy 能 够 生成 虚假 报 文 m'， 在 其 中 声称 她 就 是 Alice， 计 算 
H(m') 并 发 送 给 Bob (m', H(m')), 4 Bob 接收 到 该 报 文 ， 一 切 将 在 步骤 3 中 核对 通 
it, FFA Bob 无 法 猜 出 这 种 不 轨 的 行为 。 

为 了 执行 报 文 完整 性 ， 除 了 使 用 密码 散 列 函数 外 ，Alice 和 Bob 将 需要 共享 秘密 s。 这 
个 共享 的 秘密 只 不 过 是 一 个 比特 串 ， 它 被 称 为 鉴别 密 钥 (authentication key)。 使 用 这 个 共 
享 秘密 ， 报 文 完整 性 能 够 执行 如 下 : 

1) Alice 生成 报 文 m, H s REK m 以 生成 m +s， 并 计算 散 列 H(m+s) (例如 使 用 
SHA-1)。H(m+s) 被 称 为 报 文 鉴别 码 (Message Authentication Code, MAC) 。 
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2) 然后 Alice 将 MAC 附加 到 报 文 mm E, AMP ERX (m，H(m +s) )， 并 将 该 扩展 
报 文 发 送 给 Bob。 

3) Bob 接收 到 一 个 扩展 报 文 (m，h) ， 由 于 知道 *， 计 算出 报 文 鉴别 码 H(m+s)。 如 
R H(m+s) =h, Bob 得 到 结论 : 一 切 正 和 常 。 

图 8-9 中 总 结 了 上 述 过 程 。 读 者 应 当 注 意 到 这 里 的 MAC (表示 “ 报 文 鉴别 码 ”) 与 用 
于 数据 链 路 层 中 的 MAC (表示 “媒体 访问 控制 ") 是 不 一 样 的 ! 


H(m+s) 
coe 






图 8-9 报 文 鉴 别 码 


MAC 的 一 个 优良 特点 是 它 不 要 求 一 种 加 密 算法 。 的 确 ， 在 许多 应 用 中 ， 包 括 前 面 讨 
论 的 链 路 状态 路 由 选择 算法 ， 通 信 实 体 仅 关心 报 文 完整 性 ， 并 不 关心 报 文 机 密 性 。 使 用 
MAC, ， 实 体能 够 鉴别 它们 相互 发 送 的 报 文 ， 而 不 必 在 完整 性 过 程 中 综合 进 复杂 的 加 密 
过 程 。 

如 你 所 猜测 ， 多 年 来 已 经 提出 了 若干 种 对 MAC 的 不 同 标准 。 目 前 最 为 流行 的 标准 是 
HMAC， 它 能 够 与 MD5 或 SHA-1 一 道 使 用 。HMAC 实际 上 通过 散 列 函数 运行 数据 和 鉴别 
密 钥 两 次 | Kaufman 1995; RFC 2104], 

这 里 还 遗留 下 一 个 重要 问题 。 怎 样 向 通信 实体 分 发 这 个 共享 的 鉴别 密 钥 呢 ? 例如 ， 在 
链 路 状态 路 由 选择 算法 中 ， 在 某 种 程度 上 需要 向 自治 系统 中 的 每 台 路 由 器 分 发 该 秘密 鉴别 
ZH. 注意 到 所 有 路 由 器 都 能 够 使 用 相同 的 鉴别 密 钥 。) 一 名 网 络 管理 员 能 够 通过 物理 上 
访问 每 台 路 由 器 来 实际 完成 这 项 工作 。 或 者 ， 如 果 这 名 网 络 管理 员 不 够 勤快 ， 并 且 每 台 
由 器 都 有 它 自己 的 公 钥 ， 那 么 该 网 络 管理 员 能 够 用 路 由 器 的 公 钥 加 密 鉴 别 密 钥 并 分 发 给 任 
何 一 台 路 由 器 ， 从 而 通过 网 络 向 路 由 需 发 送 加 密 的 密 钥 。 


8. 3.3 数字 签名 


回想 在 过 去 的 一 周 中 你 在 纸 上 已 经 签 过 多 少 次 你 的 名 字 。 你 可 能 经 常会 在 支票 、 信 用 
卡 收据 、 法 律 文件 和 信件 上 签名 。 你 的 签名 证 明 你 (而 不 是 其 他 人 ) 承认 和 /或 同意 这 些 
文件 的 内 容 。 在 数字 领域 ， 人 们 通常 需要 指出 一 个 文件 的 所 有 者 或 创作 者 ， 或 者 表明 某 人 
认可 一 个 文件 内 容 。 数 字 签名 (digital signature) 就 是 一 种 在 数字 领域 实现 这 些 目标 的 密 
码 技术 。 

正如 手工 签字 一 样 ， 数 字 签 名 也 应 当 以 可 鉴别 的 、 不 可 伪造 的 方式 进行 。 这 就 是 说 ， 
必须 能 够 证 明 由 某 个 人 在 一 个 文件 上 的 签名 确实 是 由 该 人 签署 的 (该 签名 必须 是 可 证 实 
的 )， 且 只 有 那个 人 能 够 签署 那个 文件 (该 签名 无 法 伪造 ) 。 
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我 们 现在 来 考虑 怎样 设计 一 个 数字 签名 方案 。 当 Bob 签署 一 个 报 文 时 ， 可 以 观察 到 
Bob 必须 将 某 些 对 他 独特 的 东西 放置 在 该 报 文 上 。Bob 可 以 考虑 附加 一 个 MAC 用 作 签 名 ， 
其 中 MAC 是 由 他 的 密 钥 (对 他 是 独特 的 ) 作用 到 该 报 文 上 而 生成 的 ， 然 后 得 到 该 散 列 值 。 
而 Alice 为 了 验证 该 签名 ， 她 必须 也 具有 该 密 钥 的 副本 ， 在 这 种 情况 下 该 密 钥 对 Bob 将 不 
是 唯一 的 。 因 此 ， 此 时 MAC 是 无 法 胜任 这 项 工作 的 。 

前 面 讲 过 使 用 公 钥 密码 ，Bob 具有 公 钥 和 私 钥 ， 这 两 种 密 钥 对 Bob 均 为 独特 的 。 因 
此 ， 公 钥 密 钥 是 一 种 提供 数字 签名 的 优秀 候选 者 。 我 们 现在 来 研究 一 下 这 是 怎样 完成 的 。 

假设 Bob 要 以 数字 方式 签署 一 个 文档 m。 我 们 能 够 想象 这 个 文档 是 Bob 打算 签署 并 发 
送 的 一 个 文件 或 一 个 报 文 。 如 图 8- 10 AR, 为 了 签署 这 个 文档 ，Bob 直接 使 用 他 的 私 铀 
Ks 计算 Ks (m)。 乍 一 看 ， 会 感觉 很 奇怪 ，Bob 怎么 会 用 他 的 私 钥 (在 8.2 节 中 ， 我 们 用 
私 钥 解密 用 其 公 钥 加 密 的 报 文 ) 签署 文档 ! 但 是 回想 加 密 和 解密 都 只 不 过 是 数学 运算 
(RSA 中 所 做 的 e 或 d 指数 过 运算 ; 参见 8.2 节 ) ， 并 且 Bob 的 目的 不 是 弄 乱 或 掩盖 文档 的 
内 容 ， 而 只 是 以 可 鉴别 、 不 可 伪造 的 方式 签署 这 个 文档 。Bob 对 文档 m 签名 之 后 所 得 的 文 
档 就 是 Ks (m). 





签名 的 报 文 : Ks (m) 


== 
Bob #4, 4AK ; 





图 8-10 ”为 一 个 文档 生成 一 个 数据 签名 


数字 签名 Ks (m) 是 否 满足 了 可 鉴别 、 不 可 伪造 的 需求 ? 假设 Alice 有 m 和 Ks (m), 
她 要 在 法 庭 上 证 明 (进行 诉讼 ) Bob 确实 签署 过 这 个 文档 ， 他 就 是 唯一 能 够 签署 该 文档 的 
A. Alice 持 有 Bob WAH K; ， 并 把 它 用 于 Bob 的 数字 签名 Ks (m), ， 从 而 得 到 了 文档 mm。 
也 就 是 说 ，Alice 计算 Ki (Ki (m)) RE! 在 Alice 经 历 了 令 人 注目 的 慌乱 后 得 到 了 m, € 
与 初始 文档 完全 一 致 。 然 后 ，Alice 就 可 以 论证 仅 有 Bob 能 够 签署 这 个 文档 ， 基 于 如 下 
理由 : 
© 无 论 是 谁 签署 这 个 报 文 ， 都 必定 在 计算 签名 Ks (m) 过 程 中 使 用 了 Ks 这 个 私 钥 ， 
使 Ki (Ks (m)) =m, 
e 知道 Ks 这 个 私 钥 的 唯一 人 只 有 Bob。 从 8. 2 节 我 们 对 RSA 的 讨论 中 可 知 ， 知 道 公 
钥 Ks 无 助 于 得 知 私 钥 Ks 的 信息 。 因 此 ， 知 道 私 钥 Ki 的 人 才 是 生成 密 钥 对 
(Ks ，Ks ) 的 人 ， 而 这 个 人 首当其冲 就 是 Bob。( 注意 到 此 处 假设 Bob 没有 把 Ks 
泄露 给 任何 人 ， 也 没有 人 从 Bob 处 窃取 到 Ks o) 
注意 到 下 列 问题 是 重要 的 : 如 果 源 文档 m 被 修改 过 ， 比 如 改 成 了 另 一 个 文档 m'， 则 
Bob 对 m 生成 的 签名 对 m EA, HA Ki (Ks (m)) 不 等 于 mm 。 因 此 我 们 看 到 数字 签名 也 
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提供 完整 性 ， 使 得 接收 方 验证 该 报 文 未 被 自 改 ， 同 时 也 验证 了 该 报 文 的 源 。 

对 用 加 密 进 行 数据 签名 的 担心 是 ,加 密 和 解密 的 计算 代价 昂贵 。 给 定 加 解密 的 开销 ， 
通过 完全 加 密 / 解 密 对 数据 签名 是 杀 鸡 用 牛刀 。 更 有 效 的 方法 是 将 散 列 函数 引入 数字 签名 。 
8. 3. 2 节 中 讲 过 ， 一 种 散 列 算法 取 一 个 任意 长 的 报 文 m， 计算 生成 该 报 文 的 一 个 固定 长 度 
HE HSC, RIRA Hm) 。 使 用 散 列 函数 ，Bob 对 报 文 的 散 列 签名 而 不 是 对 报 文本 
身 签名 ， 即 Bob 计算 Ks (H (m)). AA H(m) 通常 比 报 文 m 小 得 多 ,所 以 生成 数字 签 
名 所 需要 的 计算 量 大 为 降低 。 

在 Bob 向 Alice 发 送 一 个 报 文 的 情况 下 ， 图 8-11 提供 了 生成 数字 签名 的 操作 过 程 的 概 
Wo Bob 让 他 的 初始 长 报 文通 过 一 个 散 列 函数 。 然 后 他 用 自己 的 私 钥 对 得 到 的 散 列 进行 数 
字 签 名 。 明 文 形 式 的 初始 报 文 连 同 已 经 数字 签名 的 报 文摘 要 《〈 从 此 以 后 可 称 为 数字 签名 ) 
一 道 被 发 送 给 Alice。 图 8-12 提供 了 鉴别 报 文 完整 性 的 操作 过 程 的 概览 。Alice 先 把 发 送 方 
的 公 钥 应 用 于 报 文 获得 一 个 散 列 结果 。 然 后 她 再 把 该 散 列 函 数 应 用 于 明文 报 文 以 得 到 第 二 
个 散 列 结果 。 如 果 这 两 个 散 列 匹配 ， 则 Alice 可 以 确信 报 文 的 完整 性 及 其 发 送 方 。 


r 长 报 文 


Dear Alice: 
This is a VERY long letter 
since there is so much to 


oe 多 对 一 散 列 函数 












固定 长 度 散 列 








发 送 给 Alice 的 包 = iy ae, 
F kope 50069cmxw 加 密 算 法 — 0 
te ee ee a rp 
ALSAK 3 





图 8-11 发 送 数字 签名 的 报 文 


在 继续 学 习 之 前 ， 我 们 简要 地 将 数字 签名 与 MAC 进行 比较 ， 尽 管 它们 有 类 似 之 处 ， 
但 也 有 重要 的 微妙 差异 。 数 字 签 名 和 MAC 都 以 一 个 报 文 (或 一 个 文档 ) 开始 。 为 了 从 
该 报 文中 生成 一 个 MAC， 我 们 为 该 报 文 附加 一 个 鉴别 密 铀 ， 然 后 取得 该 结果 的 散 列 。 
注意 到 在 生成 MAC 过 程 中 既 不 涉及 公开 密 钥 加 密 ， 也 不 涉及 对 称 密 钥 加 密 。 为 了 生成 
一 个 数字 签名 ， 我们 首先 取得 该 报 文 的 散 列 ， 然 后 用 我 们 的 私 钥 加 密 该 报 文 (使 用 公 钠 
密码 )。 因 此 ， 数 字 签 名 是 一 种 “技术 含量 更 高 ”的 技术 ， 因 为 它 需 要 一 个 如 后 面 描 述 
的 、 具 有 认证 中 心 支撑 的 公 钥 基础 设施 (PKI) 。 我 们 将 在 8.4 节 中 看 到 ，PGP 是 一 种 流 
行 的 安全 电子 邮件 系统 ， 为 了 报 文 完 整 性 而 使 用 数字 签名 。 我 们 已 经 看 到 了 OSPF 为 了 
报 文 完整 性 而 使 用 MAC。 我 们 将 在 8.5 节 和 8.6 节 中 看 到 MAC 也 能 用 于 流行 的 运输 层 
和 网 络 层 安全 协议 。 
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Dear Alice: 
This is a VERY long letter 
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定 长 度 散 列 


图 8-12 验证 签名 报 文 

公 钥 认证 

数字 签名 的 一 个 重要 应 用 是 公 钥 认证 (public key certification) ， 即 证 实 一 个 公 钥 属于 
某 个 特定 的 实体 。 公 钥 认 证 用 在 许多 流行 的 安全 网 络 协 议 中 ， 包 括 IPsec 和 

为 了 深入 理解 这 个 问题 ， 我 们 考虑 一 个 因特网 商务 版 本 的 经 典 的 “比萨 恶作剧 "。 假 
E Alice 正在 从 事 比 萨 派 送 业 务 ， 从 因特网 上 接受 订单 。Bob 是 一 个 爱 吃 比萨 的 人 ， 他 癌 
Alice 发 送 了 一 份 包含 其 家 庭 地 址 和 他 希望 的 比萨 类 型 的 明文 报 文 。Bob 在 这 个 报 文中 也 包 
含 一 个 数字 签名 〈( 即 对 原始 明文 报 文 的 签名 的 散 列 ) ， 以 向 Alice 证 实 他 是 该 报 文 的 真正 来 
源 。 为 了 验证 这 个 数字 签名 ，Alice 获得 了 Bob WAH (也 许 从 公 钥 服务 器 或 通过 电子 邮 
FRX) 并 核对 该 数字 签名 。 通 过 这 种 方式 ，Alice 确信 是 Bob 而 不 是 某 些 青少年 恶作剧 
者 下 的 比萨 订单 。 

在 聪明 的 Trudy 出 现 之 前 ， 这 一 切 看 起 来 进行 得 相当 好 。 如 图 8-13 中 所 示 ，Trudy it 
HTAR o Trudy [A] Alice 发 送 一 个 报 文 ， 在 这 个 报 文中 她 说 她 是 Bob， 给 出 了 
Bob 家 的 地 址 并 订购 了 一 个 比萨 。 在 这 个 报 文中 ， 她 也 包括 了 她 (Trudy) WAH, RA 
Alice 自然 地 假定 它 就 是 Bob 的 公 钥 。Trudy 也 附加 了 一 个 签名 ， 但 这 是 用 她 自己 (Trudy) 
的 私 钥 生 成 的 。 在 收 到 该 报 文 后 ，Alice 就 会 用 Trudy WAH (Alice 认为 它 是 Bob WAH) 
来 解密 该 数字 签名 ， 并 得 到 结论 : 这 个 明文 报 文 确实 是 由 Bob 生成 的 。 而 当 外 送 人 员 市 着 
具有 意大利 辣 香 肠 和 凤 尾 鱼 的 比萨 到 达 Bob 家 时 ， 他 会 感到 非常 惊讶 ! 

从 这 个 例子 我 们 看 到 ， 要 使 公 钥 密码 有 用 ， 需 要 能 够 证 实 你 具有 的 公 钥 实际 上 就 是 与 
你 要 进行 通信 的 实体 ( 人员、 路 由 器 、 浏 览 器 等 ) 的 公 钥 。 例 如 ， 当 Alice 与 Bob 使 用 公 
钥 密 码 通 信 时 ， 她 需要 证 实 她 假定 是 Bob 的 那个 公 钥 确实 就 是 Bob NAH. 

将 公 钥 与 特定 实体 绑 定 通常 是 由 认证 中 心 (Certification Authority, CA) 完成 的 ，CA 
的 职责 就 是 使 识别 和 发 行 证 书 合法 化 。CA 具有 下 列 作 用 : 


HHEPRABR PHBE 403 


多 对 一 散 列 函数 





使 用 Trudy 的 私 钥 
进行 签名 的 报 文摘 要 
1 pee ee 









aa” 


8-13 Trudy HAHAA E E Bob 


1) CA 证 实 一 个 实体 (一 个 人 、 一 台 路 由 器 等 ) 的 真实 身份 。 如 何 进 行 认 证 并 没有 
强制 的 过 程 。 当 与 一 个 CA 打交道 时 ,一 方 必须 信任 这 个 CA 能 够 执行 适当 的 严格 身份 验 
证 。 例 如 ， 如 果 Trudy 走 进 名 为 Fly-by- Night 的 认证 中 心 并 只 是 宣称 “我 是 Alice”， 就 可 以 
得 到 该 机 构 颁发 的 与 Alice 的 身份 相关 联 的 证 书 的 话 ， 则 人 们 不 会 对 Fly-by- Night 认证 中 心 
所 签发 的 公 钥 证 书 有 太 多 的 信任 。 另 一 方面 ， 人 们 可 能 愿意 (或 不 愿意 !) 信任 某 个 CA, 
如 果 这 个 CA 是 联邦 或 州 计划 的 一 部 分 的 话 。 你 对 与 公 钥 相 关联 的 身份 的 信任 程度 ， 仅 能 
达到 你 对 CA 及 其 身份 验证 技术 的 信任 程度 。 我 们 编织 了 多 么 混乱 的 信任 关系 网 啊 ! 

2) 一 旦 CA 验证 了 某 个 实体 的 身份 ， 这 个 CA 会 生成 一 个 将 其 身份 和 实体 的 公 钥 绑 定 
起 来 的 证 书 (certificate) 。 这 个 证 书包 含 这 个 公 钥 和 公 钥 所 有 者 全 局 唯一 的 身份 标识 信息 
(例如 ， 一 个 人 的 名 字 或 一 个 卫 地 址 ) H CA 对 这 个 证 书 进行 数字 签名 。 这 些 步 又 显示 
在 图 8-14 中 。 l 

我 们 现在 来 看 怎样 使 用 认证 来 对 搞 j 
“比萨 订购 ”中 的 恶作剧 者 (如 Trudy) 
和 其 他 意外 情况 。Bob 下 订单 的 同时 ， 
他 也 发 送 了 其 CA 签署 的 证 书 。Alice 使 
用 CA 的 公 钥 来 核对 Bob 证 书 的 合法 性 
并 提取 Bob 的 公 钥 。 

国际 电信 联盟 (International Tele- 
communication Union, ITU) 和 IETF 都 
研发 了 用 于 CA 的 系列 标准 。ITU X. 509 
[ITU 2005a] 规定 了 证 书 的 鉴别 服务 以 
及 特定 语法 。 [ RFC 1422] 描述 了 安全 图 8-14 Bob 获得 一 份 来 自 CA 的 证 书 


认证 中 心 
(CA) 









Bob 的 CA 签署 的 
证 书包 含 了 他 的 
SAK; 
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因特网 电子 邮件 所 用 的 基于 CA 的 密 钥 管理 。 它 和 X. 509 FRA, 但 比 X. 509 增加 了 密 钥 管 
理 体系 结构 的 创建 过 程 和 约定 内 容 。 表 8-4 显示 了 一 份 证 书 中 的 某 些 重要 字段 。 


表 8-4 在 X. 509 和 RFC 1422 公 钥 证 书 中 的 部 分 字段 


字段 名 描述 

版 本 (Version) X. 509 规范 的 版 本 号 

序列 号 (Serial number) CA 发 布 的 证 书 的 独特 标识 符 

签名 (Signature) 规定 了 由 CA 所 用 的 对 该 证 书签 名 的 算法 

颁发 者 名 称 (Issuer name) 发 行 该 证 书 的 CA 的 标识 符 ， 用 的 是 区 别名 (DN) 格式 [RFC 4514] 

有 效 期 (Validity period ) 证 书 合法 性 开始 和 结束 的 时 间 范 围 

主题 名 (Subject name) 其 公 钥 与 该 证 书 相 联系 的 实体 标识 符 ， 用 DN 格式 

主题 公 钥 (Subject public key) 该 主题 的 公 钥 以 及 该 公 钥 使 用 的 公 钥 算法 (及 其 参数 ) 的 指示 
8.4 端点 鉴别 


端点 鉴别 (end-point authentication) 就 是 一 个 实体 经 过 计算 机 网 络 向 另 一 个 实体 证 明 
其 身份 的 过 程 ， 例 如 一 个 人 回 某 个 电子 邮件 服务 器 证 明 其 身份 。 作 为 人 类 ， 我 们 通过 多 种 
方式 互相 鉴别 : 见面 时 我 们 互相 识别 对 方 的 面容 ， 打 电话 时 我 们 分 辨 对 方 的 声音 ， 海 关 的 
检查 官员 通过 护照 上 的 照片 对 我 们 进行 鉴别 。 

在 本 节 中 ， 我 们 讨论 经 网 络 通信 的 双方 如 何 能 够 鉴别 彼此 。 此 处 我 们 重点 关注 当 通 信 实 际 
发 生 时 鉴别 “活动 的 ”实体 。 一 个 具体 的 例子 是 一 个 用 户 向 某 电 子 邮 件 服务 器 鉴别 他 或 她 自 
己 。 这 与 证 明 在 过 去 的 某 点 接收 到 的 报 文 确实 来 自 声称 的 发 送 方 稍 有 不 同 ， 如 8.3 节 所 述 。 

当 经 网 络 进行 鉴别 时 ， 通 信 各 方 不 能 依靠 生物 信息 比如 外 表 、 声 波纹 等 进行 身份 鉴 
别 。 的 确 ， 我 们 会 在 后 面 的 实例 研究 中 看 到 ， 诸 如 路 由 器 、 客 户 / 服 务 器 进程 等 网 络 元 素 
通常 必须 相互 鉴别 。 此 处 ， 鉴 别 应 当 在 报 文 和 数据 交换 的 基础 上 ， 作 为 某 鉴别 协议 (au- 
thentication protocol) 的 一 部 分 独立 完成 。 鉴 别 协议 通常 在 两 个 通信 实体 运行 其 他 协议 (A 
如 ， 可 靠 数 据 传输 协议 、 路 由 选择 信息 交换 协议 或 电子 邮件 协议 ) 之 前 运行 。 鉴 别 协议 首 
先 建立 相互 满意 的 各 方 的 标识 ; 仅 当 鉴别 完成 之 后 ， 各 方才 继续 下 面 的 工作 。 

同 第 3 章 中 我 们 阐释 可 靠 数据 传输 协议 (rdt) 的 情况 类 似 ， 我们 发 现 阐释 各 种 版 本 
的 鉴别 协议 一 一 我 们 将 称 为 ap (authentication protocol) 一 一 是 有 启发 的 ， 并 随 着 我 们 学 
习 的 深入 指出 各 个 版 本 的 漏洞 。 (如 果 你 喜欢 这 种 逐步 式 的 设计 演化 ， 你 也 许 喜 欢 看 
[Bryant 1988 ] ， 这 本 书 虚 构 了 开放 网 络 鉴别 系统 的 设计 者 间 的 故事 ， 以 及 他 们 对 许多 相关 
奇妙 问题 的 发 现 。) | | 

我 们 假设 Alice 要 向 Bob 鉴别 她 自 Alice Bob Alice 
己 的 身份 。 全 

我 是 Alice 


8.4.1 鉴别 协议 ap1.0 
也 许 我 们 能 够 想象 出 的 最 简单 的 鉴 ¢ 









别 协议 就 是 : Alice 直接 发 送 一 个 报 文 nS 
给 Bob， 说 她 就 是 Alice。 这 个 协议 如 
图 8-15$ 所 示 。 这 个 协议 的 缺陷 是 明显 Tuay 


的 ， 即 Bob 无 法 判断 发 送 报 文 “我 是 图 8-15 协议 apl. 0 和 一 种 失败 的 情况 


Trudy 
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Alice” AY A WASC REE Alice, MM, Trudy (入侵 者 ) 也 可 以 发 送 这 样 的 报 文 。 
8.4.2 鉴别 协议 ap2.0 


如 果 Alice 有 一 个 总 是 用 于 通信 的 周知 网 络 地 址 (如 一 个 全 地 址 ) ， 则 Bob 能 够 试图 
通过 验证 携带 鉴别 报 文 的 IP 数据 报 的 源 地 址 是 否 与 Alice 的 周知 IP 地 址 相 匹 配 来 进行 鉴 
别 。 在 这 种 情况 下 ，Alice 就 可 被 鉴别 了 。 这 可 能 阻止 对 网 络 一 无 所 知 的 人 假冒 Alice， 但 
是 它 却 不 能 阻止 决定 学 习 本 书 的 学 生 或 许多 其 他 人 ! 

根据 我 们 学 习 的 网 络 层 和 数据 链 路 层 的 知识 ， 我 们 就 会 知道 做 下 列 事情 并 不 困难 ( 例 
如 ， 如 果 一 个 人 能 够 访问 操作 系统 代码 并 能 构建 自己 的 操作 系统 内 核 一 一 比如 Linux 和 许多 
其 他 免费 可 用 的 操作 系统 ) : 生成 一 个 卫 数 据 报 ， 并 在 卫 数据 报 中 填 人 我 们 希望 的 任意 源 地 
址 (比如 Alice 的 周知 IP 地 址 ) ， 再 通过 链 路 层 协议 把 生成 的 数据 报 发 送 到 第 一 跳 路 由 器 。 
此 后 ， 具 有 不 正确 源 地 址 的 数据 报 就 会 忠实 地 向 Bob 转发 。 这 种 方法 显示 在 图 8-16 中 ， 它 是 
IP 哄骗 的 一 种 形式 。 如 果 Trudy 的 第 一 Alice Bob Alice Bob 
跳 路 由 器 被 设置 为 只 转发 包含 Trudy 的 e 2 
IP 源 地 址 的 数据 报 ， 就 可 以 避免 下 哄 我 是 Alice 
骗 [RFC 2827] 。 然 而 ,这 一 措施 并 未 anma 
得 到 广泛 采用 或 强制 实施 。Bob 可 能 因 





为 假定 Trudy 的 网 络 管理 员 (这 个 管理 

员 可 能 就 是 Trudy 自己 ) 已 经 配置 Trudy 
的 第 一 跳 路 由 器 ， 使 之 只 能 转发 适当 地 Trudy 
址 的 数据 报 而 被 欺骗 。 


图 8-16 协议 ap2.0 和 一 种 失败 的 情况 
8.4.3 鉴别 协议 ap3. 0 


”进行 鉴别 的 一 种 经 典 方法 是 使 用 秘 
密 口令 。 H 令 是 鉴别 者 和 被 鉴 别 | 者 之 间 Alice Bob Alice 


Bob 
的 一 个 共享 秘密 。CGCmail、Telnet、FTP © D kó 9 
和 许多 其 他 服务 使 用 口令 鉴别 。 在 协议 我 是 Alice， 口 令 oF 
ap3.0 中 ，Alice 因此 向 Bob 发 送 其 秘密 


口令 ， 如 图 8-17 所 示 。 a Eg 
由 于 口令 的 广泛 使 用 ,我 们 也 许 狂 € | 和 

想 协议 ap3.0 相当 安全 。 如 果 这 样 想 ， 

我 们 就 错 了 ! 这 里 的 安全 性 缺陷 相当 明 Trudy Trudy 


fe: 如 果 Trudy 窃听 了 Alice 的 通信 ， 则 BA: 

可 得 到 Alice 的 口令 。 为 了 使 你 认识 到 这 aem 

种 可 能 性 ， 考 虑 这 样 的 事实 ， 当 你 Tel- 

net 到 另 一 个 机 器 上 并 登录 时 ， 登 录 口令 Wa ONRAN 

未 加 密 就 发 送 到 了 Telnet 服务 器 。 连 接 到 Telnet 客户 或 服务 器 LAN 的 某 个 人 都 可 能 嗅 探 
(sniff) ( 读 并 存储 ) 在 局 域 网 上 传输 的 所 有 数据 分 组 ， 并 因此 窃取 到 该 注册 口令 。 实 际 
上 ， 这 是 一 种 窃取 口令 的 周知 方法 Colin, BIH [Jimenez 1997] ) 。 这 样 的 威胁 显然 是 真 
实 存在 的 ， 所 以 协议 ap3. 0 明显 也 不 可 行 。 
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8.4.4 鉴别 协议 ap3. 1 


我 们 完善 协议 ap3. 0 的 下 一 个 想法 自然 就 是 加 密 口 令 了 。 通 过 加 密 口令 ， 我 们 能 够 防 
ik Trudy 得 知 Alice 的 口令 。 如 果 我 们 假定 Alice 和 Bob 共享 一 个 对 称 秘密 密 钥 KK_s， 则 
Alice AJ INOS, Fie) Bob 发 送 其 识别 报 文 “ 我 是 Alice” 和 加 密 的 口令 。Bob 则 解密 
口令 ， 如 果 口 令 正确 则 鉴别 了 Alice, AX Alice 不 仅 知道 口令 ， 而 且 知 道 用 于 加 密 口 令 的 
共享 秘密 密 钥 值 ，Bob 才 可 以 轻松 地 鉴别 Alice 的 身份 。 我 们 称 这 个 协议 为 ap3. 1。 

尽管 协议 ap3. 1 确实 防止 了 Trudy 得 知 Alice 的 口令 ， 此 处 使 用 密码 术 并 不 能 解决 鉴别 
问题 。Bob 受制 于 回放 攻击 (playback attack); Trudy Ae HF Alice 的 通信 ， 并 记录 下 该 
口令 的 加 密 版 本 ， 并 向 Bob 回放 该 口令 的 加 密 版 本 ， 以 假装 她 就 是 Alice。 协 议 ap3. 1 中 加 
密 口 令 的 使 用 ， 并 未 使 它 比 图 8-17 中 的 协议 ap3. 0 的 局 面 有 明显 改观 。 


8.4.5 鉴别 协议 ap4.0 


图 8-17 中 的 失败 的 情况 是 因为 Bob 不 能 区 分 Alice 的 初始 鉴别 报 文 和 后 来 人 侵 者 回放 
的 Alice 的 初始 鉴别 报 文 所 致 。 也 就 是 说 ，Bob 无 法 判断 Alice 是 否 还 活跃 ( 即 当 前 是 否 还 
在 连接 的 另 一 端 ) ， 或 他 接收 到 的 报 文 是 否 就 是 前 面 鉴 别 Alice 时 录制 的 回放 。 观 察 力 极 强 
的 读者 会 记 起 TCP 的 三 次 握手 协议 需要 处 理 相同 的 问题 ， 如 果 接 收 的 SYN FRC ELH A E 
早 连接 的 一 个 SYN 报 文 段 的 旧 副 本 〈 重 新 传输 ) 的 话 ，TCP 连接 的 服务 器 一 侧 不 会 接受 
该 连接 。TCP 服务 器 一 侧 如 何 解 决 “判断 客户 是 否 真 正 还 活跃” 的 问题 呢 ?” 它 选择 一 个 很 
长 时 间 内 都 不 会 再 次 使 用 的 初始 序号 ， 然 后 把 这 个 序号 发 给 客户 ， 然 后 等 待 客户 以 包含 这 
个 序号 的 ACK 报 文 段 来 响应 。 此 处 我 们 能 够 为 鉴别 目的 采用 同样 的 思路 。 

不 重 数 (nonce) 是 在 一 个 协议 的 生存 期 中 只 使 用 一 次 的 数 。 也 就 是 说 ,一 旦 某 协议 
使 用 了 一 个 不 重 数 ， 就 永远 不 会 再 使 用 那个 数字 了 。 协 议 ap4.0 以 如 下 方式 使 用 一 个 不 
重 数 : 

1) Alice 回 Bob 发 送 报 文 “RE Alice”, 

2) Bob 选择 一 个 不 重 数 尽 ， 然 后 把 这 个 值 发 送 给 Alice。 

3) Alice 使 用 她 与 Bob 共享 的 对 称 秘密 密 钥 K, _s 来 加 密 这 个 不 重 数 ， 然 后 把 加 密 的 不 
重 数 K_s(R) AEA Bob, 与 在 协议 ap3. 1 中 一 样 ， 由 于 Alice 知道 K_s 并 用 它 加 密 一 个 
值 ， 就 使 得 Bob 知道 收 到 的 报 文 是 由 Alice 产生 的 。 这 个 不 重 数 用 于 确定 Alice 是 活跃 的 。 

4) Bob 解密 接收 到 的 报 文 。 如 果 解 密 得 到 的 不 重 数 等 于 他 发 送 给 Alice 的 那个 不 重 
数 ， 则 可 鉴别 Alice 的 身份 。 

协议 ap4. 0 如 图 8-18 所 示 。 通 过 使 用 这 个 在 生存 期 中 只 Alice Bob 
出 现 一 次 的 值 R， 然 后 核对 返回 的 值 K_s(R)，Bob 能 够 确 人 





定 两 点 : Alice 是 她 所 声称 的 那个 人 ( 因为 她 知道 加 密 R 所 | 
需 的 秘密 密 钥 ) Alice 是 活跃 的 (因为 她 已 经 加 密 了 Bob 刚 。 :一 一 


刚 产生 的 不 重 数 R) 。 >a 
不 重 数 和 对 称 密 钥 密码 体制 的 使 用 形成 了 ap4.0 的 基 。 : Ke 3 


础 。 一 个 自然 的 问题 是 ， 我 们 是 否 能 够 使 用 不 重 数 和 公开 密 : : 
钥 密 码 体 制 ( 而 不 是 对 称 密 钥 密码 体制 ) 来 解决 鉴别 问题 ? v v 
这 个 问题 将 在 本 章 后 面 的 习题 中 进行 探讨 。 图 8-18 协议 ap4.0 
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8.5 安全 电子 邮件 


在 前 面 的 各 节 中 ， 我 们 分 析 了 网 络 安全 中 的 基本 问题 ， 包 括 对 称 密 钥 密 码 体制 和 公开 
密 钥 密码 体制 、 端 点 鉴别 、 密 钥 分 发 、 报 文 完整 性 和 数字 签名 。 我 们 现在 着 手 研究 如 何 使 
用 这 些 工具 在 因特网 中 提供 安全 性 。 

有 趣 的 是 ， 为 因特网 协议 栈 上 面 4 层 的 任 一 层 提 供 安全 性 服务 是 可 能 的 。 当 为 某 一 特 
定 的 应 用 层 协 议 提供 安全 性 时 ， 则 使 用 这 一 协议 的 应 用 程序 将 能 得 到 一 种 或 多 种 安全 服 
务 ， 诸 如 机 密 性 、 鉴 别 或 完整 性 。 为 某 一 运输 层 协议 提供 安全 性 时 ， 则 所 有 使 用 这 一 协议 
的 应 用 程序 都 可 以 得 到 该 运输 层 协议 所 提供 安全 性 服务 。 在 基于 主机 到 主机 的 网 络 层 提 供 
安全 性 时 ， 则 所 有 运输 层 报 文 段 〈 当 然 也 包括 所 有 应 用 层 数 据 ) 都 可 以 得 到 该 网 络 层 所 提 
供 的 安全 服务 。 当 基于 一 条 链 路 提供 安全 性 时 ， 则 经 过 这 个 链 路 传输 的 所 有 帧 中 的 数据 都 
得 到 了 该 链 路 提供 的 安全 性 服务 。 

在 8.5 ~8.8 广 中 ,我 们 考察 了 如 何在 应 用 层 、 运 输 层 、 网 络 层 和 数据 链 路 层 中 使 用 
这 些 安全 性 工具 。 为 了 与 本 书 的 整体 框架 保持 一 致 ， 我 们 从 协议 栈 的 顶层 开始 ， 讨 论 在 应 
用 层 的 安全 性 。 我 们 的 方法 是 使 用 特定 的 应 用 程序 如 电子 邮件 ， 作 为 应 用 层 安 全 性 的 一 个 
学 习 案例 。 然 后 我 们 沿 协议 栈 回 下， 分 析 SSL 协议 〈 它 在 运输 层 提供 安全 性 ) IPsec 协议 
( 它 在 网 络 层 提 供 安全 性 )， 以 及 IEEE 802. 11 无 线 局 域 网 协议 的 安全 性 。 

你 可 能 会 感到 奇怪 : 为 什么 要 在 因特网 的 多 个 层次 上 提供 安全 性 功能 呢 ? 仅 在 网 络 层 
提供 安全 性 功能 并 加 以 实施 还 不 足够 吗 ? 对 这 个 问题 有 两 个 答案 。 首 先 ， 尽 管 可 以 通过 加 
密 数 据 报 中 的 所 有 数据 〈 即 所 有 的 运输 层 报 文 段 ) ， 以 及 通过 鉴别 所 有 数据 报 的 源 P 地 
址 ， 在 网 络 层 能 够 提供 “地 毯 式 覆 盖 ” 安 全 性 ， 但 是 却 并 不 能 提供 用 户 级 的 安全 性 。 例 
如 ， 一 个 商业 站 点 不 能 依赖 P 层 安全 性 来 鉴别 一 个 在 该 站 点 购买 商品 的 顾客 。 因 此 ， 此 
处 除了 较 低层 的 地 毯 式 履 盖 安全 性 外 ， 还 需要 更 高 层 的 安全 性 功能 。 第 二 ,: 在 协议 栈 的 较 
高 层 上 部 署 新 的 因特网 服务 (包括 安全 性 服务 ) 通常 较为 容易 。 而 等 待 在 网 络 层 上 广泛 地 
部 署 安全 性 ， 可 能 还 需要 未 来 右 干 年 才能 解决 ， 许 多 应 用 程序 的 开发 者 “着 手 做 起 来 ”， 
-并 在 他 们 中 意 的 应 用 程序 中 引入 安全 性 功能 。 一 个 典型 的 例子 就 是 PGP( Pretty Good Priva- 
cy) ， 它 提供 了 安全 电子 邮件 〈 将 在 本 节 后 面 讨 论 ) 。 由 于 只 需要 客户 和 服务 器 应 用 程序 代 
码 ，PCP 是 第 一 个 在 因特网 上 得 到 广泛 应 用 的 安全 性 技术 。 


8. 5.1 安全 电子 邮件 


我 们 现在 使 用 8.2 节 和 8.3 节 的 密码 学 原则 来 生成 一 个 安全 电子 邮件 系统 。 我 们 以 递 
进 的 方式 来 产生 这 个 高 层 设 计 ， 每 一 步 引 入 一 些 新 安全 性 服务 。 当 设计 安全 电子 邮件 系统 
时 ， 我 们 需要 记 住 最 初 在 8. 1 节 中 所 介绍 的 那个 有 趣 的 例子 ， 即 Alice 和 Bob 之 间 的 风流 
韵事 。 设 想 一 下 Alice 发 送 一 个 电子 邮件 报 文 给 Bob, ， 而 Trudy 试图 人 侵 的 情况 。 

在 做 出 为 Alice 和 Bob 设计 一 个 安全 电子 邮件 系统 的 努力 之 前 ， 我 们 应 当 首先 考虑 他 
们 最 为 希望 的 安全 特性 是 什么 。 重 中 之 重 是 机 密 性 。 正 如 8. 1 节 讨 论 的 那样 ，Alice 或 Bob 
都 不 希望 Trudy 阅读 到 Alice 所 发 送 的 电子 邮件 报 文 。Alice 和 Bob 最 希望 在 该 电子 邮件 系 
统 中 看 到 的 第 二 种 特性 是 具备 发 送 方 鉴 别 。 特 别 是 ， 当 Bob 收 到 这 样 的 报 文 “I don’t love 
you anymore. I never want to see you again. Formerly yours, Alice (我 不 再 爱 你 了 。 我 再 也 不 
想 看 到 你 了 。Alice) ”时 ，Bob 目 然而 然 地 要 确定 这 个 报 文 确实 来 自 Alice， 而 非 Trudy 发 
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EN. Hab, AANRAAI PPE EAR E, HELL, WALK Alice 所 发 的 
报 文 在 发 送 给 Bob 的 过 程 中 没有 被 改变 。 最 后 ， 电 子 邮 件 系统 应 当 提 供 接 收 方 鉴别 ; 即 
Alice 希望 确定 她 的 确 正在 向 Bob 发 信 ， 而 不 是 向 假冒 Bob 的 其 他 人 (如 Trudy) 发 信 。 

因此 我 们 从 处 理 最 为 关注 的 机 密 性 开始 。 提 供 机 密 性 的 最 直接 方式 是 Alice 使 用 对 称 
密 钥 技术 (如 DES ak AES) 加 密 所 要 传输 的 报 文 ， 而 Bob 则 在 接收 时 对 报 文 解密 。 如 8. 2 
节 讨 论 的 那样 ， 如 果 对 称 密 钥 足 够 长 ， 且 仅 有 Alice 和 Bob 拥有 该 密 钥 ， 则 其 他 人 (包括 
Trudy) 要 想 读 懂 这 条 报 文 极 为 困难 。 尽 管 这 种 方法 直截了当 ， 但 因为 仅 有 Alice 和 Bob 具 
有 该 密 钥 的 副本 ， 这 使 得 分 发 对 称 密 钥 非常 困难 (我们 在 8. 2 节 中 讨论 过 ) 。 因 此 我 们 自 
然 就 考虑 用 其 他 方法 一 一 公开 密 钥 密 码 (例如 使 用 RSA ) 。 在 公开 密 钥 方法 中 ，Bob 使 得 
他 的 公 钥 为 公众 所 用 (例如 ， 从 一 台 公 钥 服务 器 或 其 个 人 网 页 上 得 到 ) ，Alice 用 Bob 的 公 
钥 加 密 她 的 报 文 ， 然 后 向 Bob 的 电子 邮件 地 址 发 送 该 加 密 报 文 。 当 Bob 接收 到 这 个 报 文 
时 ， 只 需 用 他 的 私 钥 即 可 解密 之 。 假 定 Alice 确定 得 到 的 公 钥 是 Bob 的 公 钥 ， 这 种 方法 是 
提供 所 和 希望 的 机 密 性 的 极 好 方法 。 然 而 ， 存 在 的 一 个 问题 是 公开 密 钥 加 密 的 效率 相对 低 
下 ， 尤 其 对 于 长 报 文 更 是 如 此 。 

为 了 克服 效率 问题 ， 我 们 利用 了 会 话 密 钥 (在 8.2.2 节 中 讨论 过 )。 具 体 来 说 : 
(DAlice 选 择 一 个 随机 对 称 会 话 密 钥 Ks; 名 用 这 个 对 称 密 钥 加 密 她 的 报 文 m; GAA Bob 的 
ARA Ks 加 密 这 个 对 称 密 钥 ; 田 级 联 该 加 密 的 报 文 和 加 密 的 对 称 密 钥 以 形成 一 个 “ 包 ”; 
向 Bob 的 电子 邮件 地 址 发 送 这 个 包 。 这 些 过 程 显示 在 图 8-19 中 (在 这 张 图 和 下 一 张 图 
中 ， 带 圈 的 “+ ”表示 级 联 ， 带 圈 的 “ - ”表示 级 联 的 分 解 ) 。 当 Bob 接收 到 这 个 包 时 : 
中 他 使 用 其 私 钥 Ks 得 到 对 称 密 钥 Ks; 人 @) 使 用 这 个 对 称 密 钥 Ks 解密 报 文 m。 


K,(m) K,(m) 
ie = K,( +) m 


K; (Ks) K, (Ks) 
Alice 发 送 电子 邮件 报 文 mm Bob 接 收 电子 邮件 报 文 六 


图 8-19 Alice 使 用 一 个 对 称 会 话 密 钥 K, 向 Bob 发 送 一 个 安全 电子 邮件 


设计 完 提供 机 密 性 的 安全 电子 邮件 系统 后 ， 现 在 我 们 设计 男 一 个 可 以 提供 发 送 方 鉴 别 
和 报 文 完整 性 的 系统 。 我 们 暂且 假设 Alice 和 Bob 目前 不 关心 机 密 性 (他们 要 和 其 他 人 分 
享 他 们 的 爱情 !) ， 只 关心 发 送 方 鉴 别 和 报 文 完整 性 。 为 了 完成 这 个 任务 ,我 们 使 用 如 8. 3 
节 所 描述 的 数字 签名 和 报 文摘 要 。 具 体 说 来 : (DAlice 对 她 要 发 送 的 报 文 m 应 用 一 个 散 列 
KA H (例如 MD5)， 从 而 得 到 一 个 报 文摘 要 ; 多 用 她 的 私 钥 K， 对 散 列 函数 的 结果 进行 
签名 ， 从 而 得 到 一 个 数字 签名 ; @ 把 初始 报 文 (未 加 密 ) 和 该 数字 签名 级 联 起 来 生成 一 个 
包 ; Om Bob 的 电子 邮件 地 址 发 送 这 个 包 。 当 Bob 接收 到 这 个 包 时 : (D 他 将 Alice M254 
Ki 应 用 到 被 签名 的 报 文摘 要 上 ; 中 将 该 操作 的 结果 与 他 自己 对 该 报 的 散 列 H 进行 比较 。 
在 图 8-20 中 阐述 了 这 些 步骤 。 如 8. 3 节 中 所 讨论 ， 如 果 这 两 个 结果 相同 ， 则 Bob 完全 可 
以 确信 这 个 报 文 来 自 Alice HAREM. 
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Alice 发 送 电子 邮件 报 文 普 Bob 接 收 电子 邮件 报 文 m 
图 8-20 ”使 用 散 列 也 数 和 数字 签名 来 提供 发 送 方 鉴别 和 报 文 完整 性 


现在 我 们 考虑 设计 一 个 提供 机 密 性 、 发 送 方 鉴别 和 报 文 完整 性 的 电子 邮件 系统 。 这 可 
以 通过 把 图 8-19 和 图 8-20 中 的 过 程 结合 起 来 而 实现 。Alice 首先 生成 一 个 预备 包 ， 化 与 
图 8-20 中 的 包 完 全 相同 ， 其 中 包含 她 的 初始 报 文 和 该 报 文 数字 签名 过 的 散 列 。 然 后 Alice 
把 这 个 预备 包 看 作 一 个 报 文 ， 再 用 图 8-19 中 的 发 送 方 的 步骤 发 送 这 个 新 报 文 ， 即 生成 一 
个 新 包 发 给 Bob, Alice 所 做 的 这 些 步骤 如 图 8-21 所 示 。 当 Bob 接收 到 这 个 包 后 ， 他 首先 
应 用 图 8-19 中 他 这 一 侧 的 步骤 ， 然 后 再 应 用 图 8-20 中 他 这 一 侧 的 步骤 。 应 当 明 确 这 一 设 
计 的 目标 是 提供 机 密 性 、 发 送 方 鉴别 和 报 文 完整 性 。 注 意 到 在 这 一 方案 中 ，Alice 两 次 使 
用 了 公开 密 钥 密 码 : 一 次 用 了 她 的 私 钥 ， 另 一 次 用 了 Bob 的 公 钥 。 类 似 地 ，Bob 也 两 次 使 
用 了 公开 密 钥 密 码 : 一 次 用 了 他 的 私 钥 ， 一 次 用 了 Alice HAH. 


K, (H(m)) 








clo 


图 8-21 Alice 使 用 对 称 密 钥 密码 、 公 开 密 钥 密 码 、 散 列 函数 和 数字 签名 来 
提供 安全 性 、 发 送 方 鉴别 和 报 文 完 整 性 

图 8-21 所 示 的 安全 电子 邮件 系统 可 能 在 大 多 数 情况 下 都 能 为 大 多 数 电 子 邮件 用 户 提 
供 满 意 的 安全 性 。 但 是 仍 有 一 个 重要 的 问题 没有 解决 。 图 8-21 中 的 设计 要 求 Alice 获得 
Bob 的 公 钥 ， 也 要 求 Bob 获得 Alice 的 公 钥 。 但 这 些 公 钥 的 分 发 并 不 是 一 个 小 问题 。 例 如 ， 
Trudy 可 能 假冒 Bob， 发 给 Alice 她 目 己 的 公 钥 ， 并 告诉 Alice 这 个 公 钥 是 Bob 的 公 钥 ， 使 
得 Trudy 就 能 接收 到 Alice 发 给 Bob 的 报 文 。 如 我 们 在 8. 3 节 所 学 ， 安 全 地 分 发 公 钥 的 一 种 
常用 方法 是 通过 CA 验证 该 公 钥 。 


tse FGF 


Philip Zimmermann F 1991 年 所 写 的 PGP (Pretty Good Privacy) 是 电子 邮件 加 密 方 案 
的 一 个 范例 [PGPI 2016 ] 。 在 公共 领域 中 有 各 种 版 本 的 PGP 可 供 使 用 ; 例如 ， 你 能 够 在 国 
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Bx PGP 的 主页 上 为 你 喜爱 的 平台 找到 PCP 软件 以 及 许多 有 趣 的 读物 [PCPI 2016], PGP 
的 设计 在 本 质 上 和 图 8-21 中 所 示 的 设计 相同 。PGP 软件 的 不 同 版 本 使 用 MDS 或 使 用 SHA 
来 计算 报 文摘 要 ; 使 用 CAST, = DES 或 IDEA 进行 对 称 密 钥 加 密 ; 使 用 RSA 进行 公开 
密 钥 加 密 。 

安装 PGP 时 ， 软 件 为 用 户 产生 一 个 公开 密 钥 对 。 该 公 钥 能 被 张贴 到 用 户 的 网 站 上 或 放置 
在 某 台 公 钥 服务 器 上 。 私 钥 则 使 用 用 
户口 令 进行 保护 。 用 户 每 次 访问 私 钥 “| Hast 
时 都 要 输入 这 个 口令 。PGP 允许 用 户 |can 1 see you tonight? 
选择 是 否 对 报 文 进行 数字 签名 、 加 密 “|Passionately yours, Alice 
报 文 ， 或 同时 进行 数字 等 名 和 加 密 。 |Version: PGP for Personal Privacy 5.0 
图 8-22 显示 了 一 个 PGP 签名 的 报 文 。 ech ee en eee Te eT ere 
这 个 报 文 在 MIME 首部 之 后 出 现 。 报 
文中 的 加 密 数 据 为 Ki (H(m)), B pe 
数字 签名 的 报 文摘 要 。 如 我 们 上 述 讨 
论 ，Bob 为 了 验证 报 文 的 完整 性 ， 需 要 得 到 Alice WAH. 

图 8-23 显示 了 一 个 秘密 PGP 报 文 。 这 个 报 文 也 出 现在 MIME 首部 之 后 。 当 然 ， 明 文 
报 文 不 包括 在 这 个 秘密 电子 邮件 报 文中 。 当 一 个 发 送 方 (例如 Alice) 要 确保 机 密 性 和 完 
整 性 时 ，PGP 在 如 图 8-23 所 示 的 报 文中 包含 一 个 类 似 于 图 8-22 中 的 报 文 。 





Version: PGP for Personal Privacy 5.0 
u2R4d+/jKmn8Bc5+hgDsqAewsDfrGdszX681iKm5F6Gc4sDfcxyt 


RfdS10juHgbcfDssWe7 /K=1KhnMikLo0+1/BvcxX4t==Ujk9PbcD4 
Thdf2awQfgHbnmKlok8iy6gThlp 
END PGP MESSAGE 





图 8-23 一 个 秘密 PGP FRI 


PGP 也 提供 了 一 种 公 钥 认 证 机 制 ， 但 是 这 种 机 制 与 更 为 传统 的 CA 差异 很 大 。PGP 公 
钥 由 一 个 可 信 Web 验证 。 当 Alice 相信 一 个 密 钥 /用 户 名 对 确实 匹配 时 ， 她 自己 就 可 以 验 
证 这 一 密 钥 / 用 户 名 对 。 此 外 ，PGP 允许 Alice 为 她 所 信任 的 用 户 鉴别 更 多 密 钥 提供 担保 。 
一 些 PGP 用 户 通过 保持 密 钥 签 署 方 (key-signing party) 互相 签署 对 方 的 密 钥 。 用 户 实 际 走 
到 一 起 ， 交 换 公 钥 ， 并 用 自己 的 私 钥 对 对 方 的 公 钥 签名 来 互相 验证 密 钥 。 


8.6 使 TCP 连接 安全 : SSL 


在 前 一 节 中 ， 我 们 看 到 对 一 个 特定 的 应 用 ( 即 电子 邮件 ) ， 密 码 技术 是 怎样 提供 机 密 
性 、 数 据 完整 性 和 端点 鉴别 的 。 在 这 一 节 中 ， 我 们 在 协议 栈 中 向 下 一 层 ， 考 察 密码 技术 如 
何 用 安全 性 服务 加 强 TCP， 该 安全 性 服务 包括 机 密 性 、 数 据 完整 性 和 端点 鉴别 。TCP 的 这 
种 强化 版 本 通常 被 称 为 安全 套 接 字 层 (Secure Socket Layer, SSL). SSL 版 本 3 的 一 个 稍 加 
修改 的 版 本 被 称 为 运输 层 安全 性 (Transport Layer Security, TLS), 已 经 由 IETF 标准 化 
[ RFC 4346 | 。 

SSL 最 初 由 Netscape 设计 ， 而 使 TCP 安全 隐 含 的 基本 思想 先 于 Netscape 的 工作 ( Bil 
如 ， 参 见 [Woo 1994] ) 。 由 于 SSL 的 颖 露头 角 ， 它 已 经 得 到 了 广泛 部 署 。SSL 得 到 了 所 有 
流行 Web 浏览 器 和 Web 服务 器 的 支持 ， 并 基本 上 被 用 于 所 有 因特网 商业 站 点 (包括 Ama- 
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zon, eBay, Yahoo! MSN 等 等 ) 。 每 年 经 SSL 花费 了 数 百 亿美 元 。 事 实 上 ， 如 果 你 使 用 信 
用 卡通 过 因特网 购买 任何 东西 的 话 ， 在 你 的 浏览 器 和 服务 器 之 间 的 通信 几乎 一 定 使 用 了 
SSL。( 当 你 使 用 浏览 器 时 , Æ URL 以 https: 开始 而 不 是 以 http 开始 ， 就 能 认定 正在 使 
用 SSL, ) 
为 了 理解 SSL 的 需求 ， 我 们 浏览 一 下 某 典 型 的 因特网 商业 的 场景 。Bob 在 Web Enp 
浪 ， 到 达 了 Alice 公司 的 站 点 ， 这 个 站 点 正在 出 售 香 水 。Alice 公司 站 点 显示 了 一 个 表格 ， 
假定 Bob 可 以 在 该 表格 中 输入 香水 的 类 型 和 所 希望 的 数量 、 他 的 地 址 和 他 的 支付 卡号 等 信 
息 。Bob 输入 这 些 信息 ， 点 击 “ 提 交 ”， 就 期 待 收 到 (通过 普通 邮政 邮件 ) 所 购买 的 香水 ; 
他 也 期 待 着 在 他 的 下 一 次 支付 卡 报 表 中 收 到 对 所 购物 品 的 支付 信息 。 所 有 这 一 切 听 起 来 不 
fi, 但 是 如 果 不 采 取 安 全 措施 ，Bob 也 许 会 有 一 些 意外 。 
© 如 果 没 有 使 用 机 密 性 ( 加密) ， 一 个 人 侵 者 可 能 截取 Bob 的 订单 并 得 到 他 的 支付 卡 
信息 。 这 个 人 侵 者 则 可 以 用 Bob 的 费用 来 购买 商品 。 
o 如 果 没 有 使 用 完整 性 ， 和 人 入侵 者 可 能 修改 Bob 的 订单 ， 让 他 购买 比 布 望 瓶 数 多 10 倍 
的 香水 。 
e 最 后 ， 如 果 没 有 使 用 服务 器 鉴别 ， 这 个 显示 Alice 公司 著名 徽标 的 服务 器 实际 上 是 
由 Trudy 维护 的 一 个 站 点 ，Trudy 正在 假冒 Alice 公司 。 当 Trudy 收 到 Bob 的 订单 
后 ， 可 能 拿 了 Bob 的 钱 一 走 了 之 。 或 者 Trudy 可 能 充当 一 名 身份 鳃 贼 ， 收 集 Bob 
的 名 字 、 地 址 和 信用 卡号 。 
SSL 通过 采用 机 密 性 、 数 据 完整 性 、 服 务 器 鉴别 和 客户 鉴别 来 强化 TCP， 就 可 以 解决 
这 些 问 题 。 
SSL 经 常用 来 为 发 生 在 HTTP 之 上 的 事务 提供 安全 性 。 然 而 ， 因 为 SSL 使 TCP 安全 
了 ， 因 此 它 能 被 应 用 于 运行 在 TCP 之 上 的 任 
何 应 用 程序 。SSL 提供 了 一 个 简单 的 具有 套 接 
字 的 应 用 编程 接口 (API), 该 接口 类 似 于 
TCP 的 API。 当 一 个 应 用 程序 要 使 用 SSL AY, 
它 包 括 了 SSL 类 / 库 。 如 在 图 8-24 中 所 示 ， 尽 
管 SSL 技术 上 位 于 应 用 层 中 , 但 从 研发 者 的 
角度 看 ， 它 是 一 个 提供 TCP 服务 的 运输 协议 ， TCP API 
MILEN TCP RA Ace PER We T 图 8-24 尽管 从 SSL 技术 上 看 位 于 应 用 层 中 ， 但 从 


8. 6.1 宏观 描述 研发 者 的 角度 看 它 是 一 个 运输 层 协议 





用 SSL 加 强 的 TCP 


我 们 从 描述 一 个 简化 的 SSL 版 本 开始 ， 这 将 使 我 们 从 宏观 上 理解 SSL 的 工作 原理 和 
工作 过 程 。 我 们 将 这 个 SSL 的 简化 版 本 称 之 为 “类 SSL”。 描 述 过 类 SSL 之 后 ， 在 下 一 
小 节 中 我 们 将 描述 真实 的 SSL， 填 充 细节 。 类 SSL (和 SSL) 具有 三 个 阶段 : 握手 、 密 
钥 导 出 和 数据 传输 。 我 们 现在 描述 针对 一 个 客户 (Bob) 和 一 个 服务 器 (Alice) 之 间 的 
通信 会 话 的 这 三 个 阶段 ， 其 中 Alice 具有 私 钥 / 公 钥 对 和 将 她 的 身份 与 其 公 钥 绑 定 的 
证 书 。 

1. 握手 

在 握手 阶段 ，Bob 需要 : O5 Alice 创建 一 条 TCP 连接; @ 验 证 Alice RA KH Alice; 
ORZA Alice 一 个 主 密 钥 ，Bob 和 Alice 持 用 该 主 密 钥 生 成 SSL 会 话 所 需 的 所 有 对 称 密 
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钥 。 这 三 个 步骤 显示 在 图 8-25 中 。 注 意 到 一 旦 创建 了 TCP Æ, Bob 就 向 Alice 发 送 一 个 
hello 报 文 。Alice 则 用 她 的 证 书 进行 响应 ， 证 书 中 包含 了 她 的 公 钥 。 如 在 8.3 节 所 讨论 ， 
因为 该 证 书 已 被 某 CA 证 实 过 ，Bob 明白 无 误 地 知道 该 公 钥 属于 Alice。 然 后 ，Bob 产生 一 
个 主 密 钥 (MS) (该 MS 将 仅 用 于 这 个 SSL 会 话 ) H Alice 的 公 钥 加 密 该 MS 以 生成 加 密 
的 主 密 钥 (EMS ) ， 并 将 该 EMS 发 送 给 

Alice, Alice 用 她 的 私 钥 解密 该 EMS 从 

而 得 到 该 MS。 在 这 个 阶段 后 ，Bob 和 一 一 P 

Alice 〈 而 无 别 的 人 ) 均 知 道 了 用 于 这 次 


SSL 会 话 的 主 密 钥 o | ae | 
— AK 


2. 密 钥 导出 
从 原则 上 讲 ，MS 此 时 已 由 Bob 和 sna 
Alice 共享 ， 它 能 够 用 作 所 有 后 继 加 密 和 {= 
数据 完整 性 检查 的 对 称 会 话 密 钥 。 然 
而 ， 对 于 Alice 和 Bob 每 人 而 言 ， 使 用 aE 
不 同 的 密码 密 铀 ， 并 且 对 于 加 密 和 完整 pag M 用 kK; 解密 EMS 
性 检查 也 使 用 不 同 的 密 钥 ， 通 常 认为 更 “(Ms)” : :得 到 MS 


为 安全 。 因 此 ，Alice 和 Bob 都 使 用 MS 8-25 类 SSL 握手 ,首先 建立 一 个 TCP 连接 
生成 4 个 密 钥 : 

e E,, HFM Bob 发 送 到 Alice 的 数据 的 会 话 加 密 密 铀 

e Ms， 用 于 从 Bob 发 送 到 Alice 的 数据 的 会 话 MAC WH 

e E, HFA Alice 发 送 到 Bob 的 数据 的 会 话 加 密 密 钥 

e M,， 用 于 从 Alice 发 送 到 Bob 的 数据 的 会 话 MAC 密 钥 

Alice 和 Bob 每 人 都 从 MS 生成 4 fiij 这 能 够 通过 直接 将 该 MS 分 为 4 个 密 钥 来 实 
现 。 (但 在 真实 的 SL 中 更 为 复杂 一 些 ， 我们 后 面 将 会 看 到 。) 在 密 钥 导出 阶段 结束 时 ， 
Alice 和 Bob 都 有 了 4 个 密 钥 。 其 中 ei tele 两 个 MAC 密 钥 将 用 
于 验证 数据 的 完整 性 。 

3. 数据 传输 

既然 Alice 和 Bob 共享 相同 的 4 个 会 话 密 钥 (Es, Mg, Ea AIM,), ， 他 们 就 能 够 经 TCP 
连接 开始 发 送 安全 的 数据 。 因 为 TCP 是 一 种 字 节 流 协议 ， 一 种 自然 的 方法 是 用 SSL 在 传输 
中 加 密 应 用 数据 ， 然 后 将 加 密 的 数据 在 传输 中 传 给 TCP。 但 是 如 果 我 们 真 的 这 样 做 ， 我 们 
将 用 于 完整 性 检查 的 MAC 置 于 何 处 呢 ? 我 们 无 疑 不 希望 等 到 TCP 会 话 结束 时 才 验 证 所 有 
Bob 数据 的 完整 性 ，Bob 数据 的 发 送 要 经 历 整 个 会 话 ! 为 了 解决 这 个 问题 ，SSL 将 数据 流 
分 割 成 记录 ， 对 每 个 记录 附加 一 个 MAC 用 于 完整 性 检查 ， 然 后 加 密 该 “记录 + MAC”。 为 
了 产生 这 个 MAC Bob 将 数据 连同 密 钥 Ms 放 入 一 个 散 列 肾 数 中 ， 如 在 8. 3 节 所 讨论 。 为 
了 加 密 “ 记 录 + MAC” 这 个 包 ，Bob 使 用 他 的 会 话 加 密 密 钥 ;。 然 后 这 个 加 密 的 包 将 传 
iA TCP 经 因特网 传输 。 

虽然 这 种 方法 几经 周折 ， 但 它 为 整个 报 文 流 提供 数据 完整 性 时 仍 未 达到 无 懈 可 击 。 特 
IÆ, BE Trudy 是 一 名 “中 间 人 ”， 并 且 有 在 Alice 和 Bob 之 间 发 送 的 TCP 报 文 段 流 中 插 
入 、 删 除 和 代替 报 文 段 的 能 力 。 例 如 ，Trudy 能 够 俘获 由 Bob 发 送 的 两 个 报 文 段 ， 颠 倒 这 
两 个 报 文 段 的 次 序 ， 调 整 TCP 报 文 段 的 序号 (这 些 未 被 加 密 ) ， 然 后 将 这 两 个 次 序 翻 转 的 
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报 文 段 发 送 给 Alice。 假 定 每 个 TCP 报 文 段 正 好 封装 了 一 个 记录 ， 我 们 现在 看 看 Alice 将 如 
何 处 理 这 些 报 文 段 。 

1) 在 Alice 端 运行 的 TCP 将 认为 一 切 正常 ， 将 这 两 个 记录 传递 给 SSL 子 层 。 

2) 在 Alice 端的 SSL 将 解密 这 两 个 记录 。 

3) 在 Alice 端的 SSL 将 使 用 在 每 个 记录 中 的 MAC 来 验证 这 两 个 记录 的 数据 完整 性 。 

4) 然后 SSL 将 解密 的 两 条 记录 的 字 节 流传 递 给 应 用 层 ; 但 是 Alice 收 到 的 完整 字 节 流 
由 于 记录 的 丰 倒 而 次 序 不 正确 ! 

敦 励 读者 观察 类 似 的 场景 ， 如 当 Trudy 删除 报 文 段 或 当 Trudy 重 放 报 文 段 时 。 

对 该 问题 的 解决 方案 如 你 可 能 猜想 的 那样 ， 那 就 是 使 用 序号 。SSL 采用 如 下 的 方式 。 
Bob 维护 一 个 序号 计数 器 ， 计 数 器 开始 为 0，Bob 每 发 送 的 一 个 SSL 记录 它 都 增加 1。Bob 
并 不 实际 在 记录 中 包括 一 个 序号 ， 但 当 他 计算 MAC 时 ， 他 把 该 序号 包括 在 MAC 的 计算 
中 。 所 以 ， 该 MAC 现在 是 数据 加 MAC 密 钥 Ms 加 当前 序号 的 散 列 。Alice 跟踪 Bob AY FF 
号 ， 通 过 在 MAC 的 计算 中 包括 适当 的 序号 ， 使 她 验证 一 条 记录 的 数据 完整 性 。SSL 序号 
的 使 用 阻止 了 Trudy 执行 诸如 重 排序 或 重 放 报 文 段 等 中 间 人 攻击 。( 为 什么 ?) 

4. SSL 记录 


SSL 记录 (以 及 类 SSL 记录 ) 显示 在 图 8-26 中 。 该 记录 由 类 型 字段 、 版 本 字段 、 
长 度 字 段 、 数 据 字 段 和 MAC 字段 组 成 。 注 意 到 前 三 个 字段 是 不 加 密 的 。 类 型 字段 指出 
了 该 字段 是 握手 报 文 还 是 包含 应 用 数据 的 报 文 。 它 也 用 于 关闭 SSL 连接 ， 如 下 面 所 讨 
论 。 在 接收 端的 SSL 使 用 长 度 字段 以 从 到 达 的 TCP 字 节 流 中 提取 SSL 记录 。 版 本 字段 是 


目 解释 的 。 
nr i AR Rc A 
td 


用 Es 加 密 
图 8-26 SSL 记录 格式 


8. 6.2 更 完整 的 描述 


前 一 小 节 涉 及 了 类 SSL 协议 ; 其 目的 是 让 我 们 对 SSL 的 工作 原理 和 工作 过 程 有 一 个 基 
本 理解 。 既 然 我 们 已 经 对 SSL 有 了 基本 了 解 ， 就 能 够 更 深入 地 研究 实际 SSL 协议 的 要 点 
了 。 为 了 配合 阅读 对 SSL 协议 的 摘 述 ， 鼓 励 读者 完成 Wireshark SSL 实验 ， 它 在 本 书 配 套 
的 Web 网 站 上 可 供 使 用 。 

1. SSL 握手 


SSL 并 不 强制 Alice 和 Bob 使 用 一 种 特定 的 对 称 密 钥 算法 、 一 种 特定 的 公 钥 算法 或 一 
种 特定 的 MAC, AZ, SSL 允许 Alice 和 Bob 在 握手 阶段 在 SSL 会 话 开 始 时 就 密码 算法 取 
得 一 致 。 此 外 ， 在 握手 阶段 ，Alice 和 Bob 彼此 发 送 不 重 数 ,该 数 被 用 于 会 话 密 钥 (Es， 
Mg, E, 和 AM4) 的 生成 中 。 真 正 的 SSL 握手 的 步骤 如 下 : 

1) 客户 发 送 它 支持 的 密码 算法 的 列表 ， 连 同一 个 客户 的 不 重 数 。 

2) 从 该 列表 中 ， 服 务 左 选择 一 种 对 称 算 法 〈 例 如 AES) 、 一 种 公 钥 算法 〈 例 如 具有 
特定 密 钥 长 度 的 RSA) 和 一 种 MAC 算法 。 它 把 它 的 选择 以 及 证 书 和 一 个 服务 器 不 重 数 返 
回 给 客户 。 
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3) 客户 验证 该 证 书 ， 提 取 服 务 器 的 公 钥 ， 生 成 一 个 前 主 密 钥 (Pre- Master Secret, 
PMS) ， 用 服务 器 的 公 钥 加 密 该 PMS， 并 将 加 密 的 PMS 发 送 给 服务 器 。 

4) 使 用 相同 的 密 钥 导 出 函数 (就 像 SSL 标准 定义 的 那样 ) ， 客 户 和 服务 器 独立 地 从 
PMS 和 不 重 数 中 计算 出 主 密 钥 (Master Secret, MS). JAIA MS 被 切片 以 生成 两 个 密码 和 
两 个 MAC 密 钥 。 此 外 ， 当 选择 的 对 称 密码 应 用 于 CBC (例如 3DES ak AES) ， 则 两 个 初始 
化 向 量 (Initialization Vector, IV) 也 从 该 MS 获得 ， 这 两 个 IV 分 别 用 于 该 连接 的 两 端 。 目 
此 以 后 ， 客 户 和 服务 器 之 间 发 送 的 所 有 报 文 均 被 加 密 和 鉴别 (使 用 MAC). 

5) 客户 发 送 所 有 握手 报 文 的 一 个 MAC。 

6) 服务 器 发 送 所 有 握手 报 文 的 一 个 MAC。 

最 后 两 个 步骤 使 握手 免 受 算 改 危害 。 为 了 理解 这 一 点 ， 观 察 在 第 一 步 中 ， 客 户 通常 提 
供 一 个 算法 列表 ， 其 中 有 些 算法 强 ， 有 些 算法 弱 。 因 为 这 些 加 密 算 法 和 密 钥 还 没有 被 协商 
好 ， 所 以 算法 的 这 张 列表 以 明文 形式 发 送 。Trudy 作为 中 间 人 ， 能 够 从 列表 中 删除 较 强 的 
算法 ， 和 迫使 客户 选择 一 种 较 弱 的 算法 。 为 了 防止 这 种 算 改 攻击 ， 在 步骤 5 中 客户 发 送 一 个 
级 联 它 已 发 送 和 接收 的 所 有 握手 报 文 的 MAC。 服 务 器 能 够 比较 这 个 MAC 与 它 已 接收 和 发 
送 的 握手 报 文 的 MAC。 如 果 有 不 一 致 ， 服 务 器 能 够 终止 该 连接 。 类 似 地 ， 服 务 器 发 送 一 
个 它 已 经 看 到 的 握手 报 文 的 MAC， 人 允许 客户 检查 不 一 致 性 。 

你 可 能 想 知道 在 步骤 1 和 步骤 2 中 存在 不 重 数 的 原因 。 序 号 不 足以 防止 报 文 段 重 放 攻 
击 吗 ? 答案 是 肯定 的 ， 但 它们 并 不 只 是 防止 “连接 重 放 攻 击 ” 。 考 虑 下 列 连 接 重 放 攻击 。 
假设 Trudy IRER T Alice 和 Bob 之 间 的 所 有 报 文 。 第 二 天 ，Trudy 冒充 Bob 并 加 Alice 发 送 
正好 是 前 一 天 Bob 向 Alice 发 送 的 相同 的 报 文 序列 。 如 果 Alice 没有 使 用 不 重 数 ， 她 将 以 前 
一 天 发 送 的 完全 相同 的 序列 报 文 进行 啊 应 。Alice 将 不 怀疑 任何 不 规矩 的 事 ， 因 为 她 接收 
到 的 每 个 报 文 将 通过 完整 性 检查 。 如 果 Alice 是 一 个 电子 商务 服务 器 ， 她 将 认为 Bob 正在 
进行 第 二 次 订购 (正好 订购 相同 的 东西 )。 在 男 一 方面 ， 在 协议 中 包括 了 一 个 不 重 数 ， 
Alice 将 对 每 个 TCP 会 话 发 送 不 同 的 不 重 数 ， 使 得 这 两 天 的 加 密 密 钥 不 同 。 因 此 ， 当 Alice 
接收 到 来 自 Trudy 重 放 的 SSL 记录 时 ， 该 记录 将 无 法 通过 完整 性 检查 ， 并 且 假 冒 的 电子 商 
务 事务 将 不 会 成 功 。 总 而 言 之 ,在 SSL 中 ， 不 重 数 用 于 防御 “连接 重 放 ”， 而 序号 用 于 防 
御 在 一 个 进行 中 的 会 话 中 重 放 个 别 分 组 。 

2. 连接 关闭 

在 某 个 时 刻 ，Bob 或 者 Alice 将 要 终止 SSL 会 话 。 一 个 方法 是 让 Bob 通过 直接 终止 底 
FRAY TCP 连接 来 结束 该 SSL 会 话 ， 这 就 是 说 ， 通 过 让 Bob fn] Alice 发 送 一 个 TCP FIN FRX 
段 。 但 是 这 种 幼稚 设计 为 截断 攻击 (truncation attack) 创造 了 条 件 ，Trudy 再 一 次 介入 一 
个 进行 中 的 SSL 会 话 中 ， 并 用 TCP FIN 过 早 地 结束 了 该 会 话 。 如 果 Trudy 这 样 做 的 话 ， 
Alice 将 会 认为 她 收 到 了 Bob 的 所 有 数据 ， 而 实际 上 她 仅 收 到 了 其 中 的 一 部 分 。 对 这 个 问 
题 的 解决 方法 是 ， 在 类 型 字段 中 指出 该 记录 是 否 是 用 于 终止 该 SSL 会 话 的 。( 尽管 SSL 类 
型 是 以 明文 形式 发 送 的 ， 但 在 接收 方 使 用 了 记录 的 MAC 对 它 进行 了 鉴别 。) 通过 包括 这 样 
一 个 字段 ， 如 果 Alice 在 收 到 一 个 关闭 SSL 记录 之 前 突然 收 到 了 一 个 TCP FIN， 她 可 能 知 
道 正 在 进行 着 某 些 机 花招 的 事情 。 

到 此 为 止 完成 了 对 SSL 的 介绍 。 我 们 已 经 看 到 它 使 用 了 在 8.2 节 和 8.3 节 讨 论 的 许多 
密码 学 原则 。 和 希望 更 深入 地 探讨 SSL 的 读者 可 以 阅读 Rescorla MAK SSL 的 可 读 性 很 强 的 
书籍 | Rescorla 2001 | 。 
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8.7 网 络 层 安 全 性 : IPsec 和 虚拟 专用 网 


IP 安全 (IP Security) 协议 更 常 被 称 为 IPsec， 它 为 网 络 层 提供 了 安全 性 。IPsec ALE 
意 两 个 网 络 层 实 体 (包括 主机 和 路 由 器 ) 之 间 的 人 P 数据 报 提供 了 安全 。 如 我 们 很 快要 描 
述 的 那样 ， 许 多 机 构 ( 公司、 政府 部 门 、 非 营利 组 织 等 等 ) 使 用 IPsec 创建 了 运行 在 公共 
因特网 之 上 的 虚拟 专用 网 (Virtual Private Network, VPN) 。 

在 学 习 IPsec 细节 之 前 ， 我 们 后 退 一 步 来 考虑 为 网 络 层 提供 机 密 性 所 包含 的 意义 。 在 
网 络 实体 对 之 间 〈 例 如 ， 两 台 路 由 器 之 间 ， 两 台 主 机 之 间 ， 或 者 路 由 器 和 主机 之 间 ) 具有 
网 络 层 机 密 性 ， 发 送 实体 加 密 它 发 送 给 接收 实体 的 所 有 数据 报 的 载荷 。 这 种 载荷 可 以 是 一 
A TCP 报 文 段 、 一 个 UDP 报 文 段 、 一 个 ICMP 报 文 等 等 。 如 果 这 样 的 网 络 层 服务 适当 的 
话 ， 从 一 个 实体 向 其 他 实体 发 送 的 所 有 数据 报 将 隐形 于 任何 可 能 嗅 探 该 网 络 的 第 三 方 ， 发 
送 的 数据 报 包 括 电 子 邮 件 、Web 网 页 、TCP 握手 报 文 和 管理 报 文 (例如 ICMP 和 SNMP)。 
正 因 为 如 此 ， 网 络 层 安全 性 被 认为 提供 了 “地 毯 覆 盖 ” 。 

除了 机 密 性 ， 网 络 层 安全 协议 潜在 地 能 够 提供 其 他 安全 性 服务 。 例 如 ， 它 能 提供 源 鉴 
别 ， 使 得 接收 实体 能 够 验证 安全 数据 报 的 源 。 网 络 层 安全 协议 能 够 提供 数据 完整 性 ， 使 得 
接收 实体 能 够 核对 在 数据 报 传输 过 程 中 可 能 出 现 的 任何 算 改 。 网 络 层 安 全 服务 也 能 提供 防 
止 重 放 攻 击 功能 ， 这 意味 着 Bob 能 够 检测 任何 攻击 者 可 能 插入 的 任何 元 余数 据 报 。 我 们 将 
很 快 看 到 IPsec 的 确 提 供 了 用 于 这 些 安 全 服务 的 机 制 ， 即 机 密 性 、 源 鉴别 、 数 据 完整 性 和 
重 放 攻击 防护 。 


8.7.1 IPsec 和 虚拟 专用 网 


跨越 在 多 个 地 理 区 域 上 的 某 机 构 常 常 希望 有 自己 的 IP 网络, 使 它 的 主机 和 服务 器 能 
够 以 一 种 安全 和 机 密 的 方式 彼此 发 送 数据 。 为 了 达到 这 个 目标 ， 该 机 构 能 够 实际 部 署 一 个 
单独 的 物理 网 络 ， 该 网 络 包括 路 由 器 、 链 路 和 DNS 基础 设施 且 与 公共 因特网 完全 分 离 。 
这 样 一 种 为 特定 的 机 构 专 用 的 分 立 网 络 被 称 为 专用 网 络 ( private network), BARAT, & 
用 网 络 可 能 耗资 巨大 ， 因 为 该 机 构 需 要 购买 、 安 装 和 维护 它 自己 的 物理 网 络 基础 设施 。 

不 同 于 部 署 和 维护 一 个 专用 网 络 ， 如 今 许 多 机 构 在 现 有 的 公共 因特网 上 创建 VPN。 使 
用 VPN， 机 构 办 公 室 之 间 的 流量 经 公共 因特网 而 不 是 经 物理 上 独立 的 网 络 发 送 。 而 为 了 提 
供 机 密 性 ， 办 公 室 之 间 的 流量 在 进入 公共 因特网 之 前 进行 加 密 。 图 8-27 中 显示 了 VPN 的 
一 个 简单 例子 。 这 里 的 机 构 由 一 个 总 部 、 一 个 分 支 机 构 和 旅行 中 的 销售 员 组 成 ,销售 员 通 
常 从 他 们 的 旅馆 房间 接 人 因特网 。 (在 该 图 中 仅 显 示 了 一 名 销售 员 。) 在 这 个 VPN 中 , 无 
论 何 时 ， 位 于 总 部 的 两 台 主 机 相互 发 送 IP 数据 报 或 位 于 分 支 机 构 的 两 台 主 机 要 通信 ， 它 
们 都 使 用 经 典 的 IPv4 (EIE IPsec 服务 ) 。 然 而 ， 当 两 台 机 构 的 主机 经 过 跨越 公共 因特网 
的 路 径 时 ， 这 些 流量 在 进入 因特网 之 前 进行 加 密 。 

为 了 感受 VPN 的 工作 过 程 ， 我 们 浏览 图 8-27 场景 中 的 一 个 简单 例子 。 当 总 部 中 的 一 
台 主 机 向 某 旅馆 中 的 某 销售 员 发 送 一 个 IP 数据 报时 ， 总 部 中 的 网 关 路 由 器 将 经 典 的 IPv4 
转换 成 为 IPsec 数据 报 ， 然 后 将 该 IPsec 数据 报 转 发 进 因 特 网 。 该 IPsec 数据 报 实际 上 具有 
传统 的 IPv4 首部 ， 因 此 在 公共 因特网 中 的 路 由 器 处 理 该 数据 报 ,， 仿佛 它 对 路 由 器 而 言 是 
一 个 普通 的 IPv4 数据 报 。 但 是 如 图 8-27 所 示 ，IPsec 数据 报 的 载荷 包括 了 一 个 IPsec 首部 ， 
该 首部 被 用 于 IPsec 处 理 ; 此 外 ，IPsec 数据 报 的 载荷 是 被 加 密 的 。 当 该 IPsec 数据 报到 达 
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HE nET, ERINDRER ae or 〈 并 提供 其 他 安全 服务 ， 如 验证 数据 完整 
性 ) ， 并 将 解密 的 载荷 传递 给 上 层 协 议 (例如 ,给 TCP 或 UDP) 。 
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图 8-27 虚拟 专用 网 


我 们 刚刚 给 出 了 某 机 构 能 够 应 用 IPsec 生成 一 个 VPN 的 高 层面 的 展望 。 为 了 通过 局 部 
看 全 局 ， 我 们 已 经 去 掉 了 许多 重要 的 细节 。 现 在 我 们 来 进行 更 深入 的 学 习 。 


8.7.2 AH 协议 和 ESP 协议 


IPsec 是 一 个 相当 复杂 的 整体 ， 即 它 被 定义 为 10 多 个 RFC 文档 。 两 个 重要 的 文档 是 
RFC 4301 和 RFC 6071， 前 者 描述 了 总 体 IP 安全 体系 结构 ， 后 者 提供 了 一 个 IPsec 协议 集 
的 概述 。 在 本 教科 书 中 我 们 的 目标 与 往常 一 样 ， 并 不 只 是 一 味 重 复 枯燥 和 星 汲 难 解 的 RFC 
文档 ， 而 是 采用 一 种 更 具 可 操作 性 和 易于 教学 的 方法 来 描述 协议 。 

在 IPsec 协议 族 中 ， 有 两 个 主要 协议 : 鉴别 首部 (Authentication Header, AH) 协议 和 
封装 安全 性 载荷 (Encapsulation Security Payload, ESP) 协议 。 当 某 源 IPsec 实体 (通常 是 
一 台 主 机 或 路 由 器 ) 向 一 个 目的 实体 〈 通 常 也 是 一 台 主 机 或 路 由 器 ) 发 送 安全 数据 报时 ， 
它 可 以 使 用 AH 协议 或 ESP 协议 来 做 到 。AH 协议 提供 源 鉴 别 和 数据 完整 性 服务 ， 但 不 提 
供 机 密 性 服务 。ESP 协议 提供 了 源 鉴 别 、 数 据 完整 性 和 机 密 性 服务 。 因 为 机 密 性 通常 对 
VPN 和 其 他 IPsec 应 用 是 至 关 重 要 的 ， 所 以 ESP 协议 的 使 用 比 AH 协议 要 广泛 得 多 。 为 了 
讲 清 IPsec 并 且 避 免 许 多 难题 ， 我 们 将 此 后 专门 关注 ESP 协议 。 鼓 励 还 想 学 习 AH 协议 的 
读者 研讨 相关 的 RFC 和 其 他 在 线 资源 。 


8.7.3 安全 关联 


IPsec 数据 报 在 网 络 实体 对 之 间 发 送 ， 例 如 两 台 主 机 之 间 、 两 台 路 由 器 之 间或 一 台 主 
机 和 一 人 台 路 由 器 之 间 。 在 从 源 实 体 向 目的 实体 发 送 IPsec 数据 报 之 前 ， 源 和 目的 实体 创建 
了 一 个 网 络 层 的 逻辑 连接 。 这 个 逻辑 连接 称 为 安全 关联 (Security Association, SA), 一 个 
SA 是 一 个 单 工 逻 辑 连接 ; 也 就 是 说 ， 它 是 从 源 到 目的 地 单 回 的 。 如 果 两 个 实体 要 互相 发 
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送 安全 数据 报 ， 则 需 创 建 两 个 SA， 每 个 方向 一 个 。 

例如 ， 再 次 考虑 图 8-27 中 那个 机 构 的 VPN。 该 机 构 由 一 个 总 部 、 一 个 分 支 机 构 和 nn 
个 旅行 销售 员 组 成 。 为 了 举例 的 缘故 ， 我 们 假设 在 总 部 和 分 支 机 构 之 间 有 双 回 IPsec 流量 ， 
并 且 总 部 和 销售 员 之 间 也 有 双向 IPsec 流量 。 在 这 个 VPN 中 ， 有 多 少 个 SA R? 为 了 回答 
这 个 问题 ， 注 意 到 在 总 部 网 关 路 由 器 和 分 支 机构 网 关 路 由 器 之 间 有 两 个 SA (一 个 方向 一 
A); 对 每 个 销售 员 的 便携 机 而 言 ， 在 总 部 网 关 和 便携 机 之 间 有 两 个 SA ( 仍 是 一 个 方向 一 
个 ) 。 因 此 ， 总 计 为 (2 +2m) 个 SA。 然 而 记 住 ， 并 非 从 网 关 路 由 器 或 便携 机 发 送 进 因 特 
网 的 所 有 流量 都 将 是 IPsec 安全 的 。 例 如 ， 总 部 中 的 一 台 主 机 可 能 要 访问 公共 因特网 中 的 
某 Web 服务 器 〈 例 如 Amazon 或 谷歌 ) 。 因 此 ， 该 网 关 路 由 器 (或 该 便携 机 ) 将 发 送 经 典 
的 IPv4 数据 报 和 安全 的 IPsec 数据 报 进 入 因特网 。 


= < 24 分 支 机 构 > 
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图 8-28 JA RI 到 R2 的 安全 关联 


我 们 现在 观察 SA 的 “内 部 ”。 为 了 使 讨论 明确 和 具体 ， 我 们 在 图 8-28 中 的 一 个 从 路 
由 器 RI 到 路 由 器 R2 的 SA 场景 下 进行 观察 。( 你 能 够 认为 路 由 器 R1 是 图 8-27 中 的 总 部 
网 关 路 由 器 ， 而 路 由 器 R2 是 图 8-27 中 的 分 支 机 构 网 关 路 由 器 。) 路 由 器 RI 将 维护 有 关 该 
SA 的 状态 信息 ， 这 将 包括 : 

e SA 的 32 比特 的 标识 符 ， 称 为 安全 参数 索引 (Security Parameter Index, SPI), 

e SA 的 初始 接口 (在 此 例 中 为 200. 168. 1.100) 和 SA 的 目的 接口 (在 此 例 中 为 
193: 68. 25) 2 
将 使 用 的 加 密 类 型 (例如 ， 具 有 CBC 的 3DES) 。 

加 密 密 钥 。 
完整 性 检查 的 类 型 (例如 ,具有 MDS 的 HMAC) 。 

© 鉴别 密 钥 。 

无 论 何 时 路 由 器 R1 需要 构建 一 个 IPsec 数据 报 经 过 这 个 SA 转发 ， 它 访问 该 状态 信息 
以 决定 它 应 当 如 何 鉴别 和 加 密 该 数据 报 。 类 似 地 ， 路 由 部 R2 将 维护 对 此 SA 的 相同 的 状 
态 信息 ， 并 将 使 用 该 信息 鉴别 和 加 密 任 何 从 该 SA 到 达 的 IPsec 数据 报 。 

一 个 IPsec 实体 〈 路 由 器 或 主机 ) 经 常 维护 许多 SA 的 状态 信息 。 例 如 ， 在 图 8-27 中 
具有 个 销售 员 的 VPN 例子 中 ， 总 部 网 关 路 由 器 维护 (2 +2n) 个 SA 的 状态 信息 。 一 个 
IPsec 实体 在 它 的 安全 关联 数据 库 (Security Association Database, SAD) 中 存储 其 所 有 SA 
的 状态 信息 ，SAD 是 实体 操作 系统 内 核 中 的 一 个 数据 结构 。 


8.7.4 IPsec 数据 报 


在 描述 了 SA 后 ， 我 们 现在 能 够 描述 实际 的 IPsec 数据 报 了 。IPsec 有 两 种 不 同 的 分 组 
形式 ， _ 种 用 于 所 谓 隧道 模式 (tunnel mode ) ， 另 一 种 用 于 所 谓 运 输 模 式 (transport 
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mode) 。 更 为 适合 VPN 的 隧道 模式 比 运输 模式 部 署 得 更 为 广泛 。 为 了 进一步 讲 清 IPsec 和 
避免 许多 难题 ， 我 们 因此 专门 关注 隧道 模式 。 一 旦 已 经 牢 牢 地 掌握 了 隧道 模式 ， 应 当 能 够 
容易 地 自学 运输 模式 。 
IPsec 数据 报 的 分 组 格式 显示 在 图 8-29 中 。 你 也 许 认 为 分 组 格式 是 枯燥 乏味 的 ， 但 我 
们 将 很 快 看 到 IPsec 数据 报 实际 上 尝 起 来 像 美 式 黑 西 哥 风味 (Tex- Mex) 美食 ! 我 们 考察 
图 8-28 的 场景 中 的 IPsec 字段 。 假 设 路 由 器 RI 接收 到 一 个 来 自主 机 172. 16.1.17 (在 总 部 
网 络 中 ) 的 普通 IPv4 数据 报 ， 该 分 组 的 目的 地 是 主机 172. 16. 2. 48 (在 分 支 机 构 网 络 中 )。 
路 由 器 RI 使 用 下 列 方法 将 这 个 “普通 IPv4 数据 报 ” 转换 成 一 个 IPsec 数据 报 : 
o 在 初始 IPv4 数据 报 〈 它 包括 初始 首部 字段 1) 后 面 附 上 一 个 “ESP 尾部 ”字段 。 
© 使 用 算法 和 由 SA 规定 的 密 钥 加 密 该 结果 。 
e 在 这 个 加 密 量 的 前 面 附加 上 一 个 称 为 “ESP 首部 ”的 字段 ， 得 到 的 包 称 为 “enchi- 
lada”( 以 疗 椒 调味 的 一 种 墨西哥 菜 。 一 -一 译 者 注 ) 。 
© 使 用 算法 和 由 SA 规定 的 密 钥 生 成 一 个 覆盖 整个 enchilada 的 鉴别 MAC, 
e 该 MAC 附加 到 enchilada 的 后 面 形 成 载荷 。 
e 最 后 ， 生 成 一 个 具有 所 有 经 典 IPv4 首部 字段 (通常 共 20 字 节 长 ) 的 全 新 他 首部 ， 
该 新 首部 附加 到 载荷 之 前 。 


被 鉴别 的 “enchilada” 





图 8-29 IPsec 数据 报 格式 


注意 到 得 到 的 IPsec 数据 报 是 一 个 货真价实 的 IPv4 数据 报 ， 它 具有 传统 的 IPv4 首部 字 
段 后 跟 一 个 载荷 。 但 在 这 个 场合 ， 该 载荷 包含 一 个 ESP 首部 、 初 始 IP 数据 报 、 一 个 ESP 
尾部 和 一 个 ESP 鉴别 字段 (具有 加 密 的 初始 数据 报 和 ESP 尾部 )。 初 始 的 人 * 数据 报 具有 
源 IP 地 址 172. 16. 1. 17 和 目的 地 址 172. 16. 2. 48 。 因 为 IPsec 数据 报 包 括 了 该 初始 IP 数据 
报 ， 这 些 地 址 被 包含 和 被 加 密 作为 IPsec 分 组 负载 的 组 成 部 分 。 但 是 在 新 IP 首部 中 的 源 和 
目的 地 IP 地 址 ， 即 在 IPsec 数据 报 的 最 左 侧 首 部 又 该 如 何 处理 呢 ? 如 你 所 猜测 ， 它 们 被 设 
置 为 位 于 隧道 两 个 端点 的 源 和 目的 地 路 由 硕 接 口 ， 也 就 是 200. 168. 1. 100 和 193. 68. 2. 23 。 
同时 ， 这 个 新 IPv4 首部 字段 中 的 协议 号 不 被 设置 为 TCP、UDP 或 SMTP， 而 是 设置 为 50， 
指示 这 是 一 个 使 用 ESP 协议 的 IPsec 数据 报 。 

在 R1 将 IPsec 数据 报 发 送 进 公 共 因 特 网 之 后 ， 它 在 到 达 R2 之 前 将 通过 许多 路 由 器 。 
这 些 路 由 器 中 的 每 个 将 处 理 该 数据 报 ， 就 像 它 是 一 个 普通 数据 报 一 样 ， 即 它们 被 完全 忘记 
这 样 的 事实 : 该 数据 报 正在 承载 IPsec 加 密 的 数据 。 对 于 这 些 公 共 因 特 网 路 由 器 ， 因 为 在 
外 面 首部 中 的 目的 IP 地 址 是 R2 ， 所 以 该 数据 报 的 最 终 目的 地 是 R2 。 

在 考察 了 如 何 构造 一 个 IPsec 数据 报 的 例子 后 ， 我 们 现在 更 仔细 地 观察 enchilada 的 组 
成 。 我 们 看 到 在 图 8-29 中 的 ESP 尾部 由 三 个 字段 组 成 : 填充 、 填 充 长 度 和 下 一 个 首部 。 
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前 面 讲 过 块 密码 要 求 被 加 密 的 报 文 必须 为 块 长 度 的 整数 倍 。 使 用 填充 〈 由 无 意义 的 字 节 组 
成 ) ， 使 得 当 其 加 上 初始 数据 报 (连同 填充 长 度 字 段 和 下 一 个 首部 字段 ) 形成 的 “ 报 文 ” 
是 块 的 整数 倍 。 填 充 长 度 字 段 指示 接收 实体 插 人 的 填充 是 多 少 (并 且 需 要 被 删除 ) 。 下 一 
个 首部 字段 指示 包含 在 载荷 数据 字段 中 数据 的 类 型 (例如 UDP) 。 载 荷 数据 (通常 是 初始 
IP 数据 报 ) 和 ESP 尾部 级 联 起 来 并 被 加 密 。 

附加 到 这 个 加 密 单 元 前 面 的 是 ESP 首部 ， 该 首部 以 明文 发 送 ， 它 由 两 个 字段 组 成 : 
SPI 字段 和 序号 字段 。SPI 字段 指示 接收 实体 该 数据 报 属于 哪个 SA; 接收 实体 则 能 够 用 该 
SPI 索引 其 SAD 以 确定 适当 的 鉴别 /解密 算法 和 密 钥 。 序 号 字段 用 于 防御 重 放 攻击 。 

发 送 实体 也 附加 一 个 鉴别 MAC。 如 前 所 述 ， 发 送 实体 跨越 整个 enchilada (由 ESP & 
部 、 初 始 IP 数据 报 和 ESP 尾部 组 成 ， 即 具有 加 密 的 数据 报 和 尾部 ) 计算 一 个 MAC。 前 面 
讲 过 为 了 计算 一 个 MAC， 发 送 方 附加 一 个 秘密 MAC 密 钥 到 该 enchilada， 进 而 计算 该 结果 
的 一 个 固定 长 度 散 列 。 

当 R2 接收 到 IPsec 数据 报时 ，R2 看 到 该 数据 报 的 目的 IP 地 址 是 R2 自身 。R2 因此 处 
理 该 数据 报 。 因 为 协议 字段 (位 于 IP 首部 最 左 侧 ) 是 50，R2 明白 应 当 对 该 数据 报 施 加 
IPsec ESP 处 理 。 第 一 ， 针 对 enchilada, R2 使 用 SPI 以 确定 该 数据 报 属于 哪个 SA。 第 二 ， 
它 计 算 该 enchilada 的 MAC 并 且 验 证 该 MAC 与 在 ESP MAC 字段 中 的 值 一 致 。 如 果 两 者 一 
致 ， 它 知道 该 enchilada KA RI 并 上 且 未 被 算 改 。 第 三 ， 它 检查 序号 字段 以 验证 该 数据 报 是 
新 的 (并 且 不 是 重 放 的 数据 报 )。 第 四 ， 它 使 用 与 SA 关联 的 解密 算法 和 密 钥 解密 该 加 密 
单元 。 第 五 ， 它 删除 填充 并 抽取 初始 的 普通 IP 报 文 。 最 后 ， 它 朝 着 其 最 终 目 的 地 将 该 初 
始 数 据 报 转发 进 分 支 机 构 网 络 。 这 个 一 种 多 么 复杂 的 秘诀 呀 ! 还 未 曾 有 人 声称 准备 并 破解 
enchilada 是 一 件 容易 的 事 | 

实际 上 还 有 另 一 个 重要 的 细微 差别 需要 处 理 。 它 以 下 列 问题 为 中 心 : 当 RI 从 位 于 总 
部 网 络 中 的 一 台 主 机 收 到 一 个 (未 加 密 的 ) 数据 报时 ， 并 且 该 数据 报 目的 地 为 总 部 以 外 的 
SET AN IP Hott, R2 怎样 才能 知道 它 应 当 将 其 转换 为 一 个 IPsec 数据 报 呢 ? 并 且 如 果 它 
由 IPsec 处 理 ，R1 如 何 知道 它 应 当 使 用 (在 其 SAD 中 的 许多 SA 中 ) 哪个 SA 来 构造 这 个 
IPsec 数据 报 呢 ? 该 问题 以 如 下 方式 解决 。 除 了 SAD 外 ，IPsec 实体 也 维护 男 一 个 数据 结 
构 ， 它 称 为 安全 策略 库 (Security Policy Database，SPD ) 。 该 SPD 指示 哪些 类 型 的 数据 报 
(作为 源 IP 地 址 、 目 的 IP 地 址 和 协议 类 型 的 孔 数 ) 将 被 IPsec 处 理 ; 并 且 对 这 些 将 被 
IPsec 处 理 的 数据 报应 当 使 用 哪个 SA。 从 某 种 意义 上 讲 ， 在 SPD 中 的 信息 指示 对 于 一 个 到 
达 的 数据 报 做 “什么 ”; E SAD 中 的 信息 指示 “怎样 ”去 做 。 

IPsec 服务 的 小 结 


IPsec 究竟 提供 什么 样 的 服务 呢 ? 我 们 从 某 攻 击 者 Trudy 的 角度 来 考察 这 些 服务 ， 
Trudy 是 一 个 中 间 人 ， 位 于 图 8-28 中 R1 和 R2 之 间 路 径 上 的 某 处 。 假 设 通 过 这 些 讨论 ， 
Trudy 不 知道 SA 所 使 用 的 鉴别 和 加 密 密 钥 。Trudy 能 够 做 些 什 么 和 不 能 够 做 些 什么 呢 ?” 第 
—, Trudy 不 能 看 到 初始 数据 报 。 如 果 事 实 如 此 ， 不仅 Trudy 看 不 到 在 初始 数据 报 中 的 数 
据 ， 而 且 也 看 不 到 协议 号 、 源 IP 地 址 和 目的 IP 地 址 。 对 于 经 该 SA 发 送 的 数据 报 ，Trudy 
仅 知 道 该 数据 报 源 于 172. 16. 1.0/24 的 某 台 主机 以 及 目的 地 为 172. 16. 2.0/24 WES EHL 
她 不 知道 它 是 否 携带 TCP, UDP 或 ICMP 数据 ; 她 不 知道 它 是 否 携带 了 HTTP, SMTP 或 某 
些 其 他 类 型 的 应 用 程序 数据 。 因 此 这 种 机 密 性 比 SSL 范围 更 为 宽广 。 第 二 ，Trudy 试图 用 
反 转 数据 报 的 某 些 比特 来 自 改 在 SA 中 的 某 个 数据 报 ， 当 该 自 改 的 数据 报到 达 R2 时 , € 
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将 难以 通过 完整 性 核查 (使 用 MAC) ， 再 次 挫败 了 Trudy 的 恶意 尝试。 第 三 ， 假 设 Trudy 
试图 假冒 R1， 生 成 一 个 源 为 200. 168. 1. 100 和 目的 地 为 193. 68. 2. 23 的 IPsec 数据 报 。 
Trudy 的 攻击 将 是 无 效 的 ， 因 为 这 个 数据 报 将 再 次 通 不 过 在 R2 的 完整 性 核查 。 最 后 ， 因 为 
IPsec 包含 序号 ，Trudy 将 不 能 够 生成 一 个 成 功 的 重 放 攻 击 。 总 而 言 之 ， 正 如 本 节 开 始 所 
A, IPsec 在 任何 通过 网 络 层 处 理 分 组 的 设备 对 之 间 ， 提 供 了 机 密 性 、 源 鉴别 、 数 据 完 整 
性 和 重 放 攻击 防护 。 


8.7.5 IKE: IPsec 中 的 密 钥 管理 


当 某 VPN 具有 少量 的 端点 时 (例如 ,图 8-28 中 只 有 两 台 路 由 器 ) ， 网 络 管理 员 能 够 
在 该 端点 的 SAD PA THEA SA 信息 (加 密 / 鉴 别 算法 和 密 钥 及 SPI)。 这 样 的 “人 工 密 钥 
法 ”对 于 一 个 大 型 VPN 显然 是 不 切实 际 的 ， 因 为 大 型 VPN 可 能 由 成 百 甚至 上 千 台 IPsec 
路 由 右 和 主机 组 成 。 大 型 的 、 地 理 上 分 散 的 部 署 要求 一 个 自动 的 机 制 来 生成 SA。IPsec 使 
用 因特网 密 钥 交换 (Internet Key Exchange, IKE) 协议 来 从 事 这 项 工作 ，IKE 由 RFC 5996 
KE Xo 
IKE 4 SSL (参见 8.6 73) 中 的 握手 具有 某 些 类 似 。 每 个 IPsec 实体 具有 一 个 证 书 ， 
该 证 书包 括 了 该 实体 的 公开 密 钥 。 如 同 使 用 SSL 一 样 ，IKE 协议 让 两 个 实体 交换 证 书 ， 协 
商 鉴别 和 加 密 算 法 ， 并 安全 地 交换 用 于 在 IPsec SA 中 生成 会 话 密 钥 的 密 钥 材料 。 与 SSL 不 
同 的 是 ，IKE 应 用 两 个 阶段 来 执行 这 些 任务 。 
我 们 来 研究 图 8-28 PRAR HA RI 和 R2 场景 下 的 这 两 个 阶段 。 第 一 个 阶段 由 R1 和 
R2 之 间 报 文 对 的 两 次 交换 组 成 : 
© 在 报 文 的 第 一 次 交换 期 间 ， 两 侧 使 用 Diffe- Hellman (参见 课 后 习题 ) 在 路 由 器 之 
间 生 成 一 个 双向 的 IKE SA。 为 了 防止 混淆， 这 个 双向 IKE SA 完全 不 同 于 8.6.3 
45 Fl 8. 6.4 节 所 讨论 的 IPsec SA。 该 IKE SA 在 这 两 台 路 由 器 之 间 提 供 了 一 个 鉴别 
的 和 加 密 的 信道 。 在 首 个 报 文 对 交换 期 间 ， 创 建 用 于 IKE SA 的 加 密 和 鉴别 的 密 
钥 。 还 创建 了 将 用 于 计算 后 期 在 阶段 2 使 用 的 IPsec SA 密 钥 的 一 个 主 密 钥 。 观 察 
在 第 一 步骤 期 间 ， 没 有 使 用 RSA 公 钥 和 私 钥 。 特 别 是 ，R1 或 R2 都 没有 通过 用 它 
们 的 私 钥 对 报 文 签字 而 泄露 其 喘 份 。 

e 在 报 文 的 第 二 次 交换 期 间 ， 两 侧 通过 对 其 报 文 签名 而 透漏 了 它们 的 身份 。 然 而 ， 
这 些 身 份 并 未 透漏 给 被 动 的 嗅 探 者 ， 因 为 这 些 报 文 是 经 过 安全 的 IKE SA 信道 发 送 
的 。 同 时 在 这 个 阶段 期 间 ， 两 侧 协商 由 IPsec SA 应 用 的 IPsec 加 密 和 鉴别 算法 。 

在 IKE 的 第 二 个 阶段 ， 两 侧 生 成 在 每 个 方向 的 一 个 SA。 在 阶段 2 结束 时 ， 对 这 两 个 
SA 的 每 一 侧 都 建立 了 加 密 和 鉴别 会 话 密 钥 。 然 后 这 两 侧 都 能 使 用 SA 来 发 送 安全 的 数据 
报 ， 如 同 8.7.3 节 和 8.7.4 节 描 述 的 那样 。 在 IKE 中 有 两 个 阶段 的 基本 动机 是 计算 成 本 ， 
即 因为 第 二 阶段 并 不 涉及 任何 公 钥 密码 ，IKE 能 够 以 相对 低 的 计算 成 本 在 两 个 IPsec 实体 
之 间 生 成 大 量 SA。 


8.8 使 无 线 LAN 安全 


在 无 线 网 络 中 安全 性 是 特别 重要 的 关注 因素 ， 因 为 这 时 携带 数据 帧 的 无 线 电波 可 以 传 
播 到 远离 包含 无 线 基站 和 主机 的 建筑 物 以 外 的 地 方 。 在 本 节 中 ， 我们 简要 介绍 了 无 线 安全 
性 。 对 于 更 为 深入 地 探讨 ， 参 见 由 Edney 和 Arbaugh 撰写 的 可 读 性 很 强 的 书 [Edney 
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2003 | 。 

在 802. 11 中 的 安全 性 问题 受到 了 技术 界 和 媒体 界 的 极 大 关注 。 在 进行 大 量 讨 论 的 同 
时 ， 一 个 几乎 没有 争论 的 事实 是 ， 看 起 来 被 广泛 认同 的 初始 802. 11 规范 具有 一 些 严 重 的 
安全 性 缺陷 。 现 在 的 确 能 够 下 载 利用 这 些 漏洞 的 公共 域 软件 ， 使 得 那些 使 用 该 普通 802. 11 
安全 性 机 制 的 用 户 面 对 安 全 性 攻击 ， 就 像 根本 没有 使 用 安全 性 措施 的 网 络 用 户 一 样 ， 门 户 
tel FF o 

在 下 面 一 节 中 ， 我 们 讨论 最 初 在 802. 11 规范 中 标准 化 的 安全 性 机 制 ， 该 规范 统称 为 
有 线 等 效 保 密 (Wired Equivalent Privacy，WEP) 。 顾 名 思 义 ，WEP 意欲 提供 类 似 于 在 有 线 
网 络 中 的 安全 性 水 平 。 接 下 来 我 们 将 讨论 WEP 中 的 安全 性 漏洞 并 讨论 802. 11i 标准 ， 后 者 
是 在 2004 年 采纳 的 802. 11 的 本 质 上 更 为 安全 的 版 本 。 


8. 8. 1 有 线 等 效 保密 


IEEE 802. 11 的 WEP 协议 设计 于 1999 年 ， 为 在 主机 和 无 线 接 人 点 ( 即 基站 ) 之 间 提 
供 鉴 别 和 数据 的 加 密 。WEP 并 没有 指定 密 钥 管 理 算法 ， 因 此 它 假定 主机 和 无 线 接 人 点 之 
间 通 过 带 外 方式 就 密 钥 达 成 了 某 种 一 致 。 鉴 别 以 下 列 方 式 进行 : 

1) 无 线 主机 通过 接 入 点 请 求 鉴别 。 | 

2) 接 人 点 以 一 个 128 字 节 的 不 重 数值 响应 该 鉴别 请 求 。 

3) 无 线 主 机 用 它 与 这 个 接 和 人 点 共享 的 密 钥 加 密 这 个 不 重 数值 。 

4) 接 人 点 解密 主机 加 密 的 不 重 数值 。 

如 果 解 密 所 得 不 重 数值 与 初始 发 给 主机 的 值 相同 ， 则 这 个 接 入 点 鉴别 了 该 主机 。 

图 8-30 阐述 了 WEP 数据 加 密 算法 。 假 定 主机 和 接 入 点 都 知道 一 个 秘密 的 40 比特 对 称 
密 钥 K,。 此 外 ， 一 个 24 比特 的 初始 向 量 CV) 附加 到 这 个 40 比特 的 密 钥 后 面 ， 产 生 用 
于 加 密 单个 帧 的 一 个 64 比特 密 钥 。 每 一 个 帧 所 使 用 的 IV 都 不 同 ， 所 以 每 一 帧 都 由 不 同 的 
64 比特 密 钥 加 密 。 加 密 以 如 下 方式 进行 。 首 先 为 每 个 数据 载荷 计算 一 个 4 字 节 的 CRC 值 
( 见 6.2 节 )。 然 后 用 RC 流 密 码 加 密 该 载荷 和 该 4 字 节 CRC。 我 们 这 里 不 涉及 RC4 的 细 
节 (细节 参见 [Schneier 1995] 和 [Edney 2003 ] ) 。 就 我 们 的 目的 而 言 ， 知 道 下 列 事实 即 
可 : 对 于 密 钥 值 (此 时 为 64 比特 (Ks, IV) 密 钥 ) RC 算法 产生 一 个 密 钥 值 的 流 为 ， 
k”,k，”,…， 这 些 密码 值 用 于 加 密 一 帧 中 的 数据 和 CRC 值 。 出 于 实用 的 目的 ， 我 们 可 以 认 
为 每 次 对 一 个 字 节 执行 这 些 操作 。 通 过 把 数据 的 第 i 字 节 d, 和 由 (Ks、IV) 对 生成 的 密 钥 
值 流 中 的 第 i 个 密 钥 kr 执行 异 或 操作 进行 加 密 ， 以 产生 密 文 的 第 i 字 节 c: 





= d, 由 k 
IV (每 帧 ) 
密 钥 序列 产生 器 (对 给 定 的 K,，IV ) 
Ks: 40 比 特 对 称 密 钥 一 
kt’ a kY os i i hey wae pe 
| i | | | | 
CPE A 
明文 帧 数据 加 CRC => d, d, d, e dy CRG is CRC, 
I | | 
| | | | | | 
t v y v v Y 
C} C3 Cc aun ite CN+1 ees Crag 


图 8-30 802.11 WEP 协议 
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如 图 8-30 中 所 示 , 该 IV 值 逐 帧 而 变化 ， 以 明文 形式 出 现在 每 一 个 WEP 加 密 的 
802. 11 帧 的 首部 中 。 接 收 方 取 它 与 发 送 方 共享 的 秘密 40 比特 对 称 密 钥 ， 添 加 上 该 IV， 并 
使 用 形成 的 64 比特 的 密 钥 〈 它 与 发 送 方 执行 加 密 所 用 的 密 钥 相同 ) 来 解密 这 个 帧 。 

d =c Qk” 

正确 使 用 RC4 算法 要 求 同 一 个 64 比特 密 钥 决 不 能 使 用 超过 1 次 。 前 面 讲 过 WEP %4 
是 每 一 帧 变换 一 次 。 对 于 某 给 定 的 K。，( 即使 它 有 变化 ， 也 是 很 少 的 ) ， 这 意味 着 只 有 2” 
个 不 同 的 密 钥 可 用 。 如 果 随 机 选择 这 些 密 钥 的 话 ， 我 们 能 够 看 到 [Edney 2003 ] ， 则 仅 在 
处 理 12 000 帧 之 后 就 选中 相同 的 IV 值 (从 而 使 用 相同 的 64 比特 密 钥 ) 的 概率 超过 99% 。 
在 1KB 帧 长 和 11Mbps 数据 传输 率 的 情况 下 ， 传输 12 000 帧 仅 需 几 秒 的 时 间 。 此 外 ， 由 于 
IV 值 在 该 帧 中 以 明文 形式 传输 ， 窃 听 者 就 会 发 现 何 时 使 用 了 一 个 重复 的 IV 值 。 

为 理解 重复 使 用 一 个 密 钥 可 能 出 现 的 几 个 问题 之 一 ， 考 虑 下 面 的 选择 明文 攻击 的 情 
况 ， 仍 以 Trudy 对 Alice 进行 攻击 为 例 。 假 定 Trudy (可 能 使 用 IP 哄骗 ) 回 Alice 发 出 一 个 
请 求 ( 例 如， 一 个 HTTP 或 FTP 请 求 ) ， 要 求 Alice 传输 内 容 已 知 的 文件 di ,d,,d; ,ds ,…， 
Trduy 也 观察 到 Alice 发 送 的 已 加 密 数据 c ,c, ,cj ,cs,…， 由 于 ud =c; 名 hk” ， 如 果 在 这 个 等 
式 两 边 同 时 异 或 cj ， 可 得 到 : 

d. De, = k” 

根据 这 个 关系 ，Trudy 就 可 以 使 用 已 知 的 d; A c; 值 计 算出 k 。 下 一 次 Trudy 看 到 使 用 
同一 IV 值 时 ， 她 将 知道 密 钥 流 为 ,hk。 ski ,…， 并 可 使 用 这 些 密 钥 解密 报 文 。 

对 于 WEP 还 有 其 他 几 个 值得 关注 的 安全 性 问题 。 [ Fluhrer 2001] 描述 了 一 种 攻击 方 
法 ， 即 当选 择 某 些 弱 密 钥 时 在 RC4 中 暴露 出 的 一 种 已 知 弱 点 。[ Stubblefield 2002] 讨论 了 
实现 和 开发 这 种 攻击 的 有 效 方法 。 对 WEP 的 另 一 种 关注 与 在 图 8-30 中 显示 并 在 802. 11 Wi 
中 传输 的 用 以 检测 载荷 中 改变 的 比特 的 CRC 比特 有 关 。 然 而 ， 攻 击 者 在 改变 加 密 内 容 
(例如 用 乱七八糟 的 东西 替代 初始 的 加 密 数 据 ) 后 ， 对 这 些 被 蔡 换 的 东西 计算 出 一 个 
CRC, HHX CRC 放置 在 WEP 帧 中 产生 一 个 将 被 接收 方 接受 的 802. 11 帧 。 此 时 所 需要 的 
是 诸如 我 们 在 8. 3 节 中 学 习 的 报 文 完整 性 技术 来 检测 内 容 算 改 或 替换 。 有 关 WEP 安全 性 
更 多 的 细节 ， 参 见 [Edney 2003; Wright 2015] 及 其 中 的 参考 文献 。 


8.8.2 IEEE 802. 111 


在 IEEE 802.11 于 1999 年 发 布 后 不 久 ， 就 开始 研发 具有 更 强 安 全 性 机 制 的 802. 11 的 
新 型 、 改 进 版 本 。 这 个 新 标准 被 称 为 802. 11i， 于 2004 年 最 终 得 到 批准 。 如 我 们 将 看 到 的 
那样 ， 虽 然 WEP 提供 了 相对 弱 的 加 密 、 仅 有 单一 方式 执行 鉴别 并 且 没 有 密 钥 分 发 机 制 ， 
但 IEEE 802. 11i 却 提供 了 强 得 多 的 加 密 形 式 、 一 种 可 扩展 的 鉴别 机 制 集合 以 及 一 种 密 钥 分 
发 机 制 。 下 面 我 们 概述 一 下 802.111; [TechOnline 2012] 是 一 篇 关于 802. 11i 的 优秀 Ci 
式 音频 ) 技术 概述 。 

图 8-31 概述 了 802. 11i 的 框架 。 除 了 无 线 客户 和 接 入 点 外 ，802. 11i 定义 了 一 台 鉴 别 
服务 器 ，AP 能 够 与 它 通信 。 鉴 别 服务 器 与 AP 的 分 离 使 得 一 台 鉴 别 服务 器 服务 于 许多 AP， 
集中 在 一 台 服 务 器 中 作出 有 关 鉴 别 和 接 人 (通常 是 敏感 ) 的 决定 ， 降 低 了 AP 的 成 本 和 复 
杂 性 。802. 11i 运行 分 为 4 个 阶段 : 

1) 发 现 。 在 发 现 阶 段 ，AP 通告 它 的 存在 以 及 它 能 够 向 无 线 客 户 节点 提供 的 鉴别 和 加 
密 形式 。 客 户 则 请 求 它 希望 的 特定 鉴别 和 加 密 形式 。 尽 管 客户 和 AP 已 经 交换 了 报 文 ， 但 
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该 客户 还 没有 被 鉴别 ， 也 还 没有 加 密 密 钥 ， 因 此 在 该 客户 能 够 通过 无 线 信 道 与 任何 远程 主 
机 通信 之 前 ， 还 需要 进行 几 个 其 他 步骤 。 
STA: 客户 站 点 
Ss AP: 接 入 点 


u E 


O 


安全 能 力 的 发 现 


O s 


ee oe 
STA 和 AS 相互 鉴别 ， 共 同 生成 主 密 钥 (MK) 。AP 作 为 “通道 ” 


AS: 鉴别 服务 器 





(3) sTA 导 出 成 对 主 密 钥 (PMK) 
AS 导 出 相同 的 PMK 发 送 给 AP 


出 STA、AP 使 用 PMK 导 出 用 于 报 文 
加 密 、 完 整 性 的 临时 密 钥 (TK) 


图 8-31 802. 11i; 运行 的 4 个 阶段 


2) 相互 鉴别 和 主 密 钥 (MK) 生成 。 鉴 别 发 生 在 无 线 客 户 和 鉴别 服务 器 之 间 。 在 这 个 
阶段 ， 接 人 点 基本 是 起 中 继 的 作用 ， 在 客户 和 鉴别 服务 器 之 间 转 发 报 文 。 可 扩展 鉴别 协议 
(Extensible Authentication Protocol, EAP) | RFC 3748] 定义 了 客户 和 鉴别 服务 器 之 间 交 互 
时 简单 的 请 求 /响应 模式 中 使 用 的 端 到 端 报 STA: 客户 站 上 eat 
文 格式 。 如 图 8-32 中 所 示 ，EAP 报 文 使 用 SAP: 接 入 点 = 
EAPoL (EAP over LAN, [IEEE 802. Ix | ) a e AN PARET, 
进行 封装 ， 并 通过 802. 11 无 线 链 路 发 送 。 

这 些 EAP 报 文 在 接 人 点 拆 封 ， 然 后 再 使 用 
-RADIUS 协议 重新 封装 ， 经 UDP/IP 传输 到 
鉴别 服务 器 。 尽 管 RADIUS 服务 器 和 协议 
| RFC 2865] 并 不 为 802. 11i MEXR, BE 
们 是 802. 11i 的 事实 上 的 标准 组 件 。 最 近 标 
准 化 的 DIAMETER 协议 [ RFC 3588 | 很 可 








图 8-32 EAP 是 一 个 端 到 端 协 议 。EAP 报 文 使 用 
EAPoL (运行 在 客户 和 接 入 点 之 间 的 无 线 


能 在 不 久 的 将 来 蔡 代 RADIUS, 链 路 上 ) 封装 ， 并 使 用 RADIUS (运行 在 
使 用 EAP， 鉴 别 服务 器 能 够 选择 若干 接 入 点 和 鉴别 服务 器 之 间 的 UDP/IP E) 


方式 中 的 一 种 来 执行 鉴别 。802. 11i 昌 未 强制 一 种 特殊 的 鉴别 方法 ， 但 经 浓 使 用 EAP- TLS 
鉴别 方案 [RFC 5216], EAP-TLS 使 用 类 似 于 我 们 在 8. 3 节 中 研究 的 公 钥 技术 (包括 不 重 
数 加 密 和 报 文摘 要 ) ， 以 允许 客户 和 鉴别 服务 器 彼此 相互 鉴别 ， 并 导出 为 双方 所 知 的 一 个 
主 密 钥 。 

3) 成 对 主 密 钥 (Pairwise Master Key，PMK) 生成 。MK 是 一 个 仅 为 客户 和 鉴别 服务 
器 所 知 的 共享 密 钥 ， 它 们 都 使 用 MK 来 生成 一 个 次 密 铀 ， 即 成 对 主 密 钥 (PMK ) 。 鉴 别 服 
Fae Ml fa] AP 发 送 该 PMK。 这 正 是 我 们 所 希望 达到 的 目的 ! 客户 和 AP 现在 具有 一 个 共享 
的 密 钥 (前面 讲 过 在 WEP 中 根本 不 涉及 密 钥 分 发 的 问题 ) ， 并 彼此 相互 鉴别 。 它 们 此 时 已 
经 快要 能 发 挥 效用 了 。 

4) 临时 密 钥 (Temporal Key, TK) 生成 。 使 用 PMK， 无 线 客 户 和 AP 现在 能 够 生成 
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附加 的 、 将 用 于 通信 的 密 钥 。 其 中 的 关键 是 临时 密 钥 ，TK 将 被 用 于 执行 经 无 线 链 路 向 任 
意 远程 主机 发 送 数据 的 链 路 级 的 加 密 。 

802. 11i 提供 了 几 种 加 密 形 式 ， 其 中 包括 基于 AES 的 加 密 方案 和 WEP 加 密 的 强化 
版 本 。 


8.9 运行 安全 性 : 防火 墙 和 入 侵 检 测 系统 


遍及 本 章 我 们 已 经 看 出 ， 因 特 网 不 是 一 个 很 安全 的 地 方 ， 即 有 坏 家 伙 出 没 ， 从 事 着 各 
种 各 样 的 破坏 活动 。 给 定 因特网 的 不 利 性 质 ， 我 们 现在 考虑 一 个 机 构 网 络 和 管理 它 的 网 络 
管理 员 。 从 网 络 管理 员 的 角度 看 ， 世 界 可 以 很 明显 地 分 为 两 个 阵营 : 一 部 分 是 好 人 ， 他 们 
属于 本 机 构 网 络 ， 可 以 用 相对 不 受 限 制 的 方式 访问 该 机 构 网 络 中 的 资源 ; 另 一 部 分 是 坏 家 
伙 ， 他 们 是 其 他 一 些 人 ， 访 问 网 络 资源 时 必须 经 过 仔细 审查 。 在 许多 机 构 中 ， 从 中 世纪 的 
城堡 到 现代 公司 的 建筑 物 ， 都 有 单一 的 出 口 / 人 口 ， 无论 好 人 坏人 出 人 该 机 构 ， 都 需要 进 
行 安 全 检查 。 在 一 个 城 保 中 ， 可 以 在 吊桥 的 一 端的 门口 执行 安全 检查 ; 在 公司 大 厦 中 ， 这 
些 工作 可 在 安全 台 完 成 。 在 计算 机 网 络 中 ， 当 通信 流量 进入 /离开 网 络 时 要 执行 安全 检查 、 
做 记录 、 丢 弃 或 转发 ， 这 些 工作 都 由 被 称 为 防火 墙 、 入 侵 检 测 系 统 (IDS) 和 入 侵 防 止 系 
统 (IPS) 的 运行 设备 来 完成 。 
8.9.1 防火 墙 


防火 墙 (firewall) 是 一 个 硬件 和 软件 的 结合 体 ， 它 将 一 个 机 构 的 内 部 网 络 与 整个 因 特 
网 隔离 开 ， 人 允许 一 些 数 据 分 组 通过 而 阻止 男 一 些 分 组 通过 。 防 火 墙 允许 网 络 管 理 员 控制 外 
部 和 被 管理 网 络 内 部 资源 之 间 的 访问 ， 这 种 控制 是 通过 管理 流入 和 流出 这 些 资源 的 流量 实 
现 的 。 防 火 墙 具有 3 个 目标 : 
。 从 外 部 到 内 部 和 从 内 部 到 外 部 的 
所 有 流量 都 通过 防火 墙 。 图 8-33 nee: fae) z 
显示 了 一 个 防火 墙 ， 位 于 被 管理 eos ao 
网 络 和 因特网 其 余部 分 之 间 的 边 “是 二 去 ME 
界 处 。 虽 然 许多 大 型 机 构 可 使 用 
多 级 防火 墙 或 分 布 式 防火 二 
[Skoudis 2006]， 但 在 对 该 网 络 
的 单一 接 入 点 处 设置 一 个 防火 
墙 ， 如 图 8-33 中 所 示 ， 这 使 得 管 
理 和 施加 安全 访问 策略 更 为 
= 权 的 流量 (由 林地 安全 AOS 在 被 管理 网 络 和 外 部 之 间 放 置 防火 寺 
策略 定义 ) 允许 通过 。 随 着 进入 和 离开 机 构 网 络 的 所 有 流量 流 经 防火 墙 ， 该 防火 
墙 能 够 限制 对 授权 流量 的 访问 。 
© 防火 墙 自身 免 于 渗透 。 防 火 墙 自身 是 一 种 与 网 络 连接 的 设备 ， 如 果 设 计 或 安 逆 不 
当 ， 将 可 能 危及 安全 ， 在 这 种 情况 下 它 仅 提供 了 一 种 安全 的 假象 〈 这 上 比 根本 没有 
防火 墙 更 糟糕 !) o 
Cisco 和 Check Point 是 当今 两 个 领先 的 防火 墙 厂商 。 你 也 能 够 容易 地 从 Linux 套件 使 





公共 因特网 
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用 iptables (通常 与 Linux 装 在 一 起 的 公共 域 软件 ) 产生 一 个 防火 墙 (分 组 过 滤器 )。 此 
外 ， 如 第 4 章 和 第 5 章 中 所 讨论 的 ， 防 火 墙 现在 经 常 在 路 由 器 中 实现 并 使 用 SDN 进行 远程 
控制 。 

防火 墙 能 够 分 为 3 类 : 传统 分 组 过 滤器 (traditional packet filter) 、 状 态 过 滤器 
(stateful filter) 和 应 用 程序 网 关 (application gateway)。 在 下 面 小 节 中 ， 我们 将 依次 学 习 
它们 。 

1. 传统 的 分 组 过 滤 顷 

如 图 8-33 所 示 ， 一 个 机 构 通常 都 有 一 个 将 其 内 部 网 络 与 其 ISP (并 因此 与 更 大 的 公共 
因特网 相连 ) 相连 的 网 关 路 由 器 。 所 有 离开 和 进入 内 部 网 络 的 流量 都 要 经 过 这 个 路 由 上 需 ， 
而 这 个 路 由 器 正 是 分 组 过 滤 (packet filtering) 出 现 的 地 方 。 分 组 过 滤 需 独立 地 检查 每 个 数 
据 报 ， 然 后 基于 管理 员 特 定 的 规则 决定 该 数据 报应 当 允 许 通 过 还 是 应 当 丢 弃 。 过 滤 决 定 通 
常 基于 下 列 因素 : 

e IP 源 或 目的 地 址 。 

e 在 IP 数据 报 中 的 协议 类 型 字段 : TCP, UDP, ICMP, OSPF 等 。 

e TCP 或 UDP 的 源 和 目的 端口 。 

e TCP 标志 比特 : SYN, ACK 等 。 

© ICMP 报 文 类 型 。 

© 数据 报 离开 和 进入 网 络 的 不 同 规则 。 

e 对 不 同 路 由 器 接口 的 不 同 规则 。 

网 络 管理 员 基 于 机 构 的 策略 配置 防火 墙 。 该 策略 可 以 考虑 用 户 生 产 率 和 带宽 使 用 以 及 
对 一 个 机 构 的 安全 性 关注 。 表 8-5 列 出 了 一 个 机 构 可 能 具有 的 若干 可 能 的 策略 ， 以 及 它们 
是 如 何 用 一 个 分 组 过 滤器 来 处 理 分 组 的 。 例 如 ， 如 果 该 机 构 除 了 允许 访问 它 的 公共 Web 
服务 器 外 不 希望 任何 人 TCP 连接 的 话 ， 那 么 它 能 够 阻挡 所 有 的 入 TCP SYN 报 文 段 , 但 具 
有 目的 地 端口 80 的 TCP SYN 报 文 段 除外 ， 并 且 该 目的 了 P 地 址 对 应 于 该 Web 服务 器 。 如 
果 该 机 构 不 希望 它 的 用 户 用 因特网 无 线 电 应 用 独占 访问 带宽 ， 那 么 它 能 够 阻挡 所 有 非 关 键 
性 UDP 流量 (因为 因特网 无 线 电 经 常 是 通过 UDP 发 送 的 )。 如 果 该 机 构 不 希望 它 的 内 部 
网 络 被 外 部 绘制 结构 图 (被 跟踪 路 由 ) ， 那 么 它 能 够 阻挡 所 有 ICMP TTL 过 期 的 报 文 离开 
该 机 构 的 网 络 。 
表 8-5 对 于 Web 服务 器 在 130. 207. 244. 203 的 某 机 构 网 络 130. 207/16 ， 其 策略 和 对 应 的 过 滤 规 则 

策略 防火 墙 设置 
无 外 部 Web 访问 丢弃 所 有 到 任何 四 地 址 、 端 口 80 的 出 分 组 


无 人 TCP 连接 ， 但 那些 只 访问 机 构 公 共 丢弃 所 有 到 除 130. 207. 244. 203 、 端 口 80 外 的 任何 地 址 的 入 TCP 
Web 服务 器 的 分 组 除外 SYN 分 组 


防止 Web 无 线 电 占据 可 用 带宽 丢弃 所 有 入 UDP 分 组 , 但 DNS 分 组 除外 

防止 你 的 网 络 被 用 于 一 个 smurf DoS 攻击 ERMAR “广播 ”地 址 〈 例 如 130. 207. 255.255) 的 ICMP 
ping 分 组 

防止 你 的 网 络 被 跟踪 路 由 丢弃 所 有 出 ICMP TTL 过 期 流量 


一 条 过 滤 策 略 能 够 基于 地 址 和 端口 号 的 结合 。 例 如 ， 一 台 过 滤 路 由 需 能 够 转发 所 有 
Telnet 数据 报 (那些 具有 端口 号 23 的 数据 报 ) ， 但 那些 包括 在 一 个 特定 的 IP 地 址 列表 中 的 
去 往 和 来 自 的 地 址 除外 。 这 些 策 略 允 许 在 许可 列表 上 的 地 址 进行 Telnet 连接 。 不 幸 的 是 ， 


426 SEE 


基于 外 部 地 址 的 策略 无 法 对 其 源 地 址 被 哄骗 的 数据 报 提供 保护 。 

过 滤 也 可 根据 TCP ACK 比特 是 否 设置 来 进行 。 如 果 一 个 机 构 要 使 内 部 客户 连接 到 外 
部 服务 器 ， 却 要 防止 外 部 客户 连接 到 内 部 服务 器 ， 这 个 技巧 很 有 效 。3. 5 节 讲 过 ， 在 每 个 
TCP 连接 中 第 一 个 报 文 段 的 ACK 比特 都 设 为 0， 而 连接 中 的 所 有 其 他 报 文 段 的 ACK 比特 
都 设 为 1。 因此 ， 如 果 一 个 机 构 要 阻止 外 部 客户 发 起 到 内 部 服务 器 的 连接 ， 就 只 需 直 接 过 
滤 进 入 的 所 有 ACK 比特 设 为 0 的 报 文 段 。 这 个 策略 去 除了 所 有 从 外 部 发 起 的 所 有 TCP 连 
接 ， 但 是 允许 内 部 发 起 TCP 连接 。 

在 路 由 器 中 使 用 访问 控制 列表 实现 防火 墙 规则 ， 每 个 路 由 器 接口 有 它 自己 的 列表 。 
K 8-6 中 显示 了 对 于 某 机 构 222. 22/16 的 访问 控制 列表 的 例子 。 该 访问 控制 列表 适用 于 
将 路 由 器 与 机 构 外 部 ISP 连接 的 某 个 接口 。 这 些 规则 被 应 用 到 通过 该 接口 自 上 而 下 传递 
的 每 个 数据 报 。 前 两 条 规则 一 起 允许 内 部 用 户 在 Web 上 冲浪 : 第 一 条 规则 允许 任何 具 
有 目的 端口 80 AY TCP 分 组 离开 该 机 构 网 络 ; 第 二 条 规则 人 允许 任何 具有 源 端口 80 H. ACK 
比特 置 位 的 TCP 分 组 进入 该 机 构 网 络 。 注 意 到 如 果 一 个 外 部 源 试 图 与 一 台 内 部 主机 建立 
一 条 TCP 连接 ， 该 连接 将 被 阻挡 ， 即 使 该 源 或 目的 端口 为 80。 接 下 来 的 两 条 规则 一 起 
允许 DNS 分 组 进入 和 离开 该 机 构 网 络 。 总 而 言 之 ， 这 种 限制 性 相当 强 的 访问 控制 列表 
阻挡 所 有 流量 ， 但 由 该 机 构 内 发 起 的 Web 流量 和 DNS 流量 除外 。[ CERT Filtering 2012 |. 
提供 了 一 个 推荐 的 端口 /协议 分 组 过 滤 的 列表 ， 以 避免 在 现 有 网 络 应 用 中 的 一 些 周 知 的 
安全 性 漏洞 。 


表 8-6 用 于 某 路 由 器 接口 的 访问 控制 列表 
T sea | eke 
ae [mane |manswnm| ror | > | o | 人 
ft = 
fi : 
ft = 


2. 状态 分 组 过 滤器 

在 传统 的 分 组 过 滤器 中 ， 根 据 每 个 分 组 分 离 地 做 出 过 滤 决 定 。 状 态 过 滤 融 实际 地 跟踪 
TCP 连接 ， 并 使 用 这 种 知识 作出 过 滤 决 定 。 

为 了 理解 状态 过 滤 磊 ， 我 们 来 重新 审视 表 8-6 中 的 访问 控制 列表 。 尽 管 限 制 性 相当 
强 ， 表 8-6 中 的 访问 控制 列表 仍然 允许 来 自 外 部 的 ACK =1 且 源 端口 为 80 的 任何 分 组 到 
达 ， 通 过 该 过 滤器 。 这 样 的 分 组 能 够 被 试图 用 异常 分 组 来 朋 演 内 部 系统 、 执 行 拒绝 服务 攻 
击 或 绘制 内 部 网 络 的 攻击 者 使 用 。 幼 稚 的 解决 方案 是 也 阻挡 TCP ACK 分 组 ,但 是 这 样 的 
方法 将 妨碍 机 构 内 部 的 用 户 在 Web 上 冲浪 。 

状态 过 滤器 通过 用 一 张 连接 表 来 跟踪 所 有 进行 中 的 TCP 连接 来 解决 这 个 问题 。 这 种 
方法 是 可 能 的 : 因为 防火 墙 能 够 通过 观察 三 次 握手 (SYN, SYNACK 和 ACK) 来 观察 一 
条 新 连接 的 开始 ; 而 且 当 它 看 到 该 连接 的 一 个 FIN 分 组 时 ， 它 能 够 观察 该 连接 的 结束 。 
当 防 火 墙 经 过 比如 说 60 秒 还 没有 看 到 该 连接 的 任何 活动 性 ， 它 也 能 够 〈 保 守 地 ) 假设 
该 连接 结束 了 。 某 防火 墙 的 一 张 连接 表 例 子 显 示 在 表 8-7 中 。 这 张 连接 表 指 示 了 当前 有 
3 条 进行 中 的 TCP 连接 ， 所 有 的 连接 都 是 从 该 机 构 内 部 发 起 的 。 此 外 ,该 状态 过 滤 句 在 
它 的 访问 控制 列表 中 包括 了 一 个 新 栏 ， 即 “核对 连接 ”， 如 表 8-8 中 所 示 。 注 意 到 表 8-8 
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与 表 8-6 中 的 访问 控制 列表 相同 ， 只 是 此 时 它 指示 应 当 核 对 其 中 两 条 规则 所 对 应 的 
连接 。 


表 8-7 人 


222 22: Oa | 37. 96. 87. 123 12699 80 
222, bbs 992 199. 1. 205. 23 37654 80 
222. 22. 65. 143 203. 77. 240. 43 48712 80 


R 8-8 eee 


mnie | 22.22/16 的 外 部 ae 1023 ofe ee T 


222. 22/16 的 外 部 | 222. 22/16 UDP = fe > 1023 We 
a [s | Sw | 4am | 人 | Sm 


我 们 浏览 某 些 例子 来 看 看 连接 表 和 扩展 的 访问 控制 列表 是 如 何 联手 工作 的 。 假 设 一 个 
攻击 者 通过 发 送 一 个 具有 TCP 源 端口 80 和 ACK 标志 置 位 的 数据 报 ， 试 图 向 机 构 网 络 中 发 
送 一 个 异常 分 组 。 进 一 步 假 设 该 分 组 具有 源 端口 号 12543 和 源 IP 地 址 150. 23. 23.155, %4 
这 个 分 组 到 防火 墙 时 ， 防 火 墙 核对 表 8-8 中 的 访问 控制 列表 ， 该 表 指 出 在 允许 该 分 组 进入 
机 构 网 络 之 前 还 必须 核对 连接 表 。 该 防火 墙 正 确 地 核对 了 连接 表 ， 发 现 这 个 分 组 不 是 某 进 
行 中 的 TCP 连接 的 一 部 分 ， 从 而 拒绝 了 该 分 组 。 举 第 二 个 例子 ,假设 一 个 内 部 的 用 户 要 在 
外 部 Web 站 点 冲浪 。 因 为 该 用 户 首先 发 送 了 一 个 TCP SYN 报 文 段 ， 所 以 该 用 户 的 TCP 连 
接 在 连接 表 中 有 了 记录 。 当 Web 服务 器 发 送 回 分 组 (ACK 比特 进行 了 必要 的 设置 ), 该 防 
火 墙 核 对 了 连接 表 并 明日 一 条 对 应 的 连接 在 进行 中 。 防 火 墙 因此 将 让 这 些 分 组 通过 ， 从 而 
不 会 干扰 内 部 用 户 的 Web 冲浪 活动 。 

3. 应 用 程序 网 关 

在 上 面 的 例子 中 ， 我 们 已 经 看 到 了 分 组 级 过 滤 使 得 一 个 机 构 可 以 根据 卫 的 内 容 和 
TCP/UDP 首部 〈 包 括 卫 地 址 、 端 口号 和 ACK 比特 ) 执行 粗 粒 度 过 滤 。 但 是 如 果 一 个 机 构 
仅 为 一 个 内 部 用 户 的 受 限 集合 〈 与 卫 地 址 情况 正 相 反 ) 提供 Telnet 服务 该 怎样 做 呢 ? 如 
果 该 机 构 要 这 些 特权 用 户 在 允许 创建 向 外 部 的 Telnet 会 话 之 前 首先 鉴别 他 们 自己 该 怎样 做 
WE? 这 些 任务 都 超出 了 传统 过 滤器 和 状态 过 滤 需 的 能 力 。 的 确 ， 有 关内 部 用 户 的 身份 信息 
是 应 用 层 数 据 ， 并 不 包括 在 IP/TCP/UDP 首部 中 。 

为 了 得 到 更 高 水 平 的 安全 性 ， 防 火 墙 必须 把 分 组 过 滤器 和 应 用 程序 网 关 结 合 起 来 。 应 
用 程序 网 关 除 了 看 IPATCPAUDP 首部 外 ， 还 基于 应 用 数据 来 做 策略 决定 。 一 个 应 用 程序 网 
关 (application gateway) 是 一 个 应 用 程序 特定 的 服务 器， 所 有 应 用 程序 数据 (入 和 出 的 ) 
都 必须 通过 它 。 多 个 应 用 程序 网 关 可 以 在 同一 主机 上 运行 , 但 是 每 一 个 网 关 都 是 有 上 自己 的 
进程 的 单独 服务 器 。 

为 了 更 深入 地 了 解 应 用 程序 网 关 ， 我 们 来 设计 一 个 防火 墙 ， 它 只 允许 内 部 客户 的 受 限 
RAHAA Telnet， 不 允许 任何 外 部 客户 向 内 Telnet。 这 一 策略 可 通过 将 分 组 过 滤 (在 一 人 台 
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路 由 器 上 ) 和 一 个 Telnet 应 用 程序 网 关 结 合 起 来 实现 ， 如 图 8-34 所 示 。 路 由 部 的 过 滤 需 
配置 为 阻塞 所 有 Telnet 连接 ， 但 从 该 应 主机 到 网 关 的 网 关 的 到 远程 主机 
用 程序 网 关 IP 地 址 发 起 的 连接 除外 。 aoe 的 Telnet 会 话 
这 样 的 过 滤器 配置 迫使 所 有 问 外 的 
Telnet 连 接 都 通过 应 用 程序 网 关 。 现 在 
考虑 一 个 要 问 外 部 Telnet 的 内 部 用 户 。 
这 个 用 户 必 须 首 先 和 应 用 程序 网 关 建 立 
— Telnet 会 话 。 在 网 关 (网 关 监 听 进 
人 的 Telnet 会 话 ) 上 一 直 运 行 的 应 用 程 
序 提示 用 户 输 入 用 户 ID 和 口令 。 当 这 
个 用 户 提 供 这 些 信息 时 ， 应 用 程序 网 关 
检查 这 个 用 户 是 否 得 到 许可 向 外 Tel- 
net, 如 果 没 有 ， 网 关 则 中 止 这 个 内 部 
用 户 向 该 网 关 发 起 的 Telnet 连接 。 如 果 
该 用 户 得 到 许可 ， 则 这 个 网 关 : 提示 
用 户 输入 它 所 要 连接 的 外 部 主机 的 主机 p834 由 应 用 程序 网 关 和 过 滤器 组 成 的 防火 墙 
名 ; @) 在 这 个 网 关 和 某 外 部 主机 之 间 建 

立 一 个 Telnet 会 话 ; 名 将 从 这 个 用 户 到 达 的 所 有 数据 中 继 到 该 外 部 主机 ， 并 且 把 来 目 这 个 外 
部 主机 的 所 有 数据 都 中 继 给 这 个 用 户 。 所 以 ， 该 Telnet 应 用 程序 网 关 不 仅 执行 用 户 授权 ， 而 
且 同 时 充当 一 个 Telnet 服务 器 和 一 个 Telnet 客户 ， 在 这 个 用 户 和 该 远程 Telnet 服务 器 之 间 中 
继 信 息 。 注 意 到 过 滤器 因为 该 网 关 发 起 向 外 部 的 Telnet 连接 ， 将 允许 执行 步骤 @)。 


















匿名 与 隐私 

假定 你 要 访问 一 个 有 争议 的 Web 网 站 (例如 某 政治 活动 家 的 网 站 ) ， 并 且 你 : OF 
想 向 该 Web 网 站 透漏 你 的 IP 地 址 ; @ 不 想 要 你 的 本 地 ISP ( 它 可 能 是 你 住家 或 办 公 室 ， 
的 ISP) 知道 你 正在 访问 该 站 点 ; @@ 不 想 要 你 的 本 地 ISP 看 到 你 正在 与 该 站 点 交换 的 数 | 
据 。 如 果 你 使 用 传统 的 方法 直接 与 该 Web 站 点 连接 而 没有 任何 加 密 ， 你 无 法 实现 这 三 | 
个 诉求 。 即 使 你 使 用 SSL， 你 也 无 法 实现 前 两 个 诉求 : 你 的 源 IP 地 址 呈现 在 你 发 送 给 
Web 网 站 的 每 个 数据 报 中 ; 你 发 送 的 每 个 分 组 的 目的 地 址 能 够 容易 地 被 你 本 地 JISP 嗅 
探 到 。 

为 了 获得 隐私 和 匿名 ， 你 能 够 使 用 如 图 8-35 所 示 的 一 种 可 信人 代理 服务 器 和 SSL 的 
组 合 。 利 用 这 种 方法 ， 你 首先 与 可 信人 代理 建立 一 条 SSL 连接 。 然 后 你 在 该 SSL 连接 中 向 
所 希望 站 点 的 网 页 发 送 一 个 HTTP 请 求 。 当 代理 接收 到 该 SSL 加 密 的 HTTP 请 求 ， 它 解 
密 请 求 并 向 Web 站 点 转发 该 明文 HTTP 请 求 。 接 下 来 Web 站 点 响应 该 代理 ， 该 代理 经 
it SSL 再 向 你 转发 该 响应 。 因 为 该 Web 站 点 仅 看 到 代理 的 卫 地址 ， 并 非 你 的 客户 IP 地 
址 ， 你 的 确 获 得 了 对 该 Web 站 点 的 匿名 访问 。 并 且 因 为 你 和 代理 之 间 的 所 有 流量 均 被 
加 密 ， 你 的 本 地 ISP 无 法 通过 对 你 访问 的 站 点 做 日 志和 记录 你 交换 的 数据 来 侵犯 你 的 隐 | 
私 。 今 天 许多 公司 (例如 proxify. com) 提供 了 这 种 代理 服务 。 
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图 8-35 利用 代理 提供 匿名 和 隐私 


当然 ， 在 这 个 解决 方案 中 ， 你 的 代理 知道 一 切 : 它 知道 你 的 IP 地 址 和 你 正在 冲浪 
的 站 点 的 卫 地址 ; 并 且 它 能 够 看 到 你 与 该 Web 站 点 之 间 以 明文 形式 交换 的 所 有 流量 。 
因此 ， 这 种 解决 方案 的 好 坏 取决 于 该 代理 的 可 信 度 。 由 TOR 匿名 和 隐私 服务 所 采用 的 
一 种 更 为 健壮 的 方法 是 ， 让 你 的 流量 路 由 通过 一 系列 “不 串通 ”的 代理 服务 器 [TOR 
2012] 。 特 别 是 ，TOR 允许 独立 的 个 体 向 其 代理 池 贡 献 代 理 。 当 某 用 户 使 用 TOR 与 一 个 
服务 器 连接 ，TOR 随机 地 (从 它 的 代理 池 ) 选择 一 条 三 个 代理 构成 的 链 ， 并 通过 该 链 
在 客户 和 服务 器 之 间 路 由 所 有 流量 。 以 这 种 方式 ， 假 设 这些 代 理 并 不 串通 ， 无 人 知道 在 
你 的 IP 地 址 和 目标 Web 站 点 之 间 发 生 的 通信 。 此 外 ， 尽 管 在 最 后 的 代理 和 服务 器 之 间 
发 送 明 文 ， 但 这 个 最 后 代理 并 不 知道 哪个 卫 地 址 正在 发 送 和 接收 明文 。 


内 部 网 络 通常 有 多 个 应 用 程序 网 关 ， 例 如 Telnet、HTTP、FTP 和 电子 邮件 网 关 。 事 实 
上 ， 一 个 机 构 的 邮件 服务 器 〈 见 2.3 节 ) 和 Web 高 速 缓存 都 是 应 用 程序 网 关 。 

应 用 程序 网 关 也 有 其 缺陷 。 首 先 ， 每 一 个 应 用 程序 都 需要 一 个 不 同 的 应 用 程序 网 关 。 
第 二 ， 因 为 所 有 数据 都 由 网 关 转 发 ， 付 出 的 性 能 负担 较 重 。 当 多 个 用 户 或 应 用 程序 使 用 同 
一 个 网 关 计 算 机 时 ， 这 成 为 特别 值得 关注 的 问题 。 最 后 ， 当 用 户 发 起 一 个 请 求 时 ， 客 户 软 
件 必须 知道 如 何 联系 这 个 网 关 ， 并 且 必 须 告诉 应 用 程序 网 关 如 何 连接 到 哪个 外 部 服务 髓 。 


8. 9.2 入 侵 检 测 系 统 


我 们 刚刚 看 到 ， 当 决定 让 哪个 分 组 通过 防火 墙 时 ， 分 组 过 滤器 (传统 的 和 状态 的 ) 检 
# IP. TCP, UDP 和 ICMP 首部 字段 。 然 而 ， 为 了 检测 多 种 攻击 类 型 ， 我 们 需要 执行 深度 
分 组 检查 (deep packet inspection) ， 即 查看 首部 字段 以 外 部 分 ， 深入 查看 分 组 携带 的 实际 
应 用 数据 。 如 我 们 在 8. 9. 1 节 所 见 ， 应 用 程序 网 关 经 常 做 深度 分 组 检查 。 而 一 个 应 用 程序 
网 关 仅 对 一 种 特定 的 应 用 程序 执行 这 种 检查 。 

显然 ， 这 为 另 一 种 设备 提供 了 商机 ， 即 一 种 不 仅 能 够 检查 所 有 通过 它 传递 的 分 组 的 首部 
(类 似 于 分 组 过 滤器 ) ， 而 且 能 执行 深度 分 组 检查 (与 分 组 过 滤器 不 同 ) 的 设备 。 当 这 样 的 
设备 观察 到 一 个 可 疑 的 分 组 时 ， 或 一 系列 可 疑 的 分 组 时 ， 它 能 够 防止 这 些 分 组 进入 该 机 构 网 
络 。 或 者 仅仅 是 因为 觉得 该 活动 可 疑 ， 该 设备 虽说 能 够 让 这 些 分 组 通过 ， 但 要 向 网 络 管理 员 
发 出 告警 ， 网 络 管理 员 然 后 密切 关注 该 流量 并 采取 适当 的 行动 。 当 观察 到 潜在 恶意 流量 时 能 
产生 告警 的 设备 称 为 入 侵 检 测 系统 (Intrusion Detection System，IDS) 。 滤 除 可 疑 流 量 的 设备 
称 为 入 侵 防 止 系 统 (Intrusion Prevention System ，IPS ) 。 在 本 节 中 我 们 一 起 学 习 IDS 和 IPS 这 
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两 种 系统 ， 因 为 这 些 系统 的 最 为 有 趣 的 技术 方面 是 它们 检测 可 疑 流 量 的 原理 〈 而 不 是 它们 是 
否 发 送 告警 或 丢弃 分 组 ) 。 我 们 因此 将 IDS 系统 和 IPS 系统 统称 为 IDS 系统 。 

IDS 能 够 用 于 检测 多 种 攻击 ， 包 插 网 络 映射 (例如 使 用 nmap 进行 分 析 ) 、 端 口 扫描 、 
TCP RHH, DoS 带宽 洪 泛 攻击 、 蠕 虫 和 病毒 、 操 作 系统 脆弱 性 攻击 和 应 用 程序 脆弱 性 攻 
击 。( 人 参见 1.6 节 有 关 网 络 攻击 的 概述 内 容 。) 目前 ， 数 以 千 计 的 机 构 应 用 了 IDS 系统 。 这 
些 已 部 署 的 系统 有 许多 是 专用 的 ，Cisco 、Check Point 和 其 他 安全 装备 厂商 在 市 场 上 销售 这 
些 系统 。 但 是 许多 已 部 署 的 IDS 系统 是 公共 域 系 统 ， 如 极为 流行 的 Snort IDS 系统 (我 们 
将 简要 讨论 它 ) 。 

一 个 机 构 可 能 在 它 的 机 构 网 络 中 部 署 一 个 或 多 个 IDS FERRE. Al 8-36 显示 了 一 个 具 
有 3 个 IDS 传感器 的 机 构 。 当 部 署 了 多 个 传感器 时 ， 它 们 通 稼 共同 工作 ， 回 一 个 中 心 IDS 
处 理 器 发 送 有 关 可 疑 流 量 活 动 的 信息 ， 中 心 处 理 器 收集 并 综合 这 些 信 息 ， 当 认为 适合 时 向 
网 络 管理 员 发 送 告警 。 在 图 8-36 中 ， 该 机 构 将 其 网 络 划分 为 两 个 区 域 : 一 个 高 度 安 全 区 
域 ， 由 分 组 过 滤器 和 应 用 程序 网 关 保 护 ， 并 且 由 IDS 系统 监视 ;一 个 较 低 度 安 全 区 域 ( 称 
之 为 非 军事 区 (DeMilitarized Zone, DMZ) ) ,该 区 域 仅 由 分 组 过 滤器 保护 ,但 也 由 IDS 系 
统 监 视 。 注 意 到 DMZ 包括 了 该 机 构 需 要 与 外 部 通信 的 服务 器 ， 如 它 的 公共 Web 服务 器 和 
它 的 权威 DNS 服务 器 。 
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图 8-36 部署 一 个 过 滤器 、 一 个 应 用 程序 网 关 和 多 个 IDS 传感器 的 机 构 


此 时 你 也 许 想 知道 ， 为 什么 使 用 多 个 IDS 传感器 ? 为 什么 在 图 8-36 中 不 只 是 在 分 组 
过 滤器 后 面 放置 一 个 IDS fee (MAR BST AWE)? 我 们 将 很 快 看 到 ，IDS 
不 仅 需 要 做 深度 分 组 检查 ， 而 且 必 须要 将 每 个 过 往 的 分 组 与 数 以 万 计 的 “特征 (signa- 
ture) ”进行 比较 ; 这 可 能 导致 极 大 的 处 理 量 ,特别 是 如 果 机 构 从 因特网 接收 每 秒 数 十 亿 
比特 的 流量 时 更 是 如 此 。 将 IDS 传感器 进一步 向 下 游 放置 ， 每 个 传感器 仅 看 到 该 机 构 流量 
的 一 部 分 ， 维 护 能 够 更 容易 。 无 论 如 何 ， 目 前 有 许多 高 性 能 IDS 和 IPS 系统 可 供 使 用 ， 许 
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多 机 构 实 际 上 能 够 在 靠近 其 接 和 人 路 由 需 附 近 只 使 用 一 个 传 感 锅 。 

IDS 系统 大 致 可 分 类 为 基于 特征 的 系统 (signature-based system) 或 基于 异常 的 系统 
(anomaly-based system) 。 基 于 特征 的 IDS 维护 了 一 个 范围 广泛 的 攻击 特征 数据 库 。 每 个 特 
征 是 与 一 个 人 侵 活 动 相关 联 的 规则 集 。 一 个 特征 可 能 只 是 有 关 单 个 分 组 的 特性 列表 〈 例 如 
源 和 目的 端口 号 、 协 议 类 型 和 在 分 组 载荷 中 的 特定 比特 串 ) ， 或 者 可 能 与 一 系列 分 组 有 关 。 
这 些 特征 通常 由 研究 了 已 知 攻击 、 技 艺 熟 练 的 网 络 安全 工程 师 生 成 。 一 个 机 构 的 网 络 管理 
员 能 够 定制 这 些 特 征 或 者 将 其 加 进 数据 库 中 。 

从 运行 上 讲 ， 基 于 特征 的 IDS 嗅 探 每 个 通过 它 的 分 组 ， 将 每 个 嗅 探 的 分 组 与 数据 库 中 
的 特征 进行 比较 。 如 果 某 分 组 (或 分 组 序列 ) 与 数据 库 中 的 一 个 特征 相 匹配 ，IDS 产生 一 
个 告警 。 该 告警 能 够 发 送 一 个 电子 邮件 报 文 给 网 络 管理 员 ， 能 够 发 送 给 网 络 管理 系统 ， 或 
只 是 做 日 志 以 供 以 后 检查 。 

尽管 基于 特征 的 IDS 系统 部 署 广泛 ， 但 仍 具 有 一 些 限 制 。 更 重要 的 是 ， 它 们 要 求 根 据 
以 前 的 攻击 知识 来 产生 一 个 准确 的 特征 。 换 言 之 ， 基 于 特征 的 IDS 对 不 得 不 记录 的 新 攻击 
完全 缺乏 判断 力 。 另 一 个 缺点 是 ， 即 使 与 一 个 特征 匹配 ; 它 也 可 能 不 是 一 个 攻击 的 结果 ， 
因此 产生 了 一 个 虚假 告警 。 最 后 ， 因 为 每 个 分 组 必须 与 范围 广泛 的 特征 集合 相 比较 ，IDS 
可 能 处 于 处 理 过 载 状态 并 因此 难以 检测 出 许多 恶意 分 组 。 

当 基 于 异常 的 IDS 观察 正常 运行 的 流量 时 ， 它 会 生成 一 个 流量 概况 文件 。 然 后 ， 它 寻 
找 统 计 上 不 寻常 的 分 组 流 ， 例 如 ，ICMP 分 组 不 寻常 的 百分比 ， 或 端口 扫描 和 ping 掠 过 导 
致 指数 性 突然 增长 。 基 于 异常 的 IDS 系统 最 大 的 特点 是 它们 不 依赖 现 有 攻击 的 以 前 知识 。 
在 另 一 方面 ， 区 分 正常 流量 和 统计 异常 流量 是 一 个 极 具 挑 战 性 的 问题 。 迄 今 为 止 ， 大 多 数 
部 署 的 IDS 主要 是 基于 特征 的 ， 尽 管 某 些 IDS 包括 了 某 些 基 于 异常 的 特性 。 

Snort 


Snort 是 一 种 公共 域 开 放 源 码 的 IDS， 现 有 部 署 达 几 十 万 [Snort 2012; Koziol 2003 ] 。 
- 它 能 够 运行 在 Linux, UNIX 和 Windows 平台 上 。 它 使 用 了 通用 的 嗅 探 接口 libpcap，Wire- 
shark 和 许多 其 他 分 组 嗅 探 器 也 使 用 了 libpcap。 它 能 够 轻松 地 处 理 100Mbps 的 流量 ; 安装 
在 千 兆 比特 / 秒 流量 速率 下 工作 ， 需 要 多 个 Snort 传感器 。 

为 了 对 Snort 有 一 些 认识 ， 我们 来 看 一 个 Snort 特征 的 例子 : 


alert icmp $EXTERNAL_NET any -> $HOME_NET any 
(msg:”ICMP PING NMAP”; dsize: 0; itype: 8;) 


这 个 特征 由 从 外 部 ($EXTERNAL_NET) 进入 机 构 网 络 ( $HOME_NET) 的 任何 IC- 
MP 分 组 所 匹配 ， 其 类 型 是 8 (ICMP ping) 并 且 具 有 空 负 载 (dsize =0)。 因 为 nmap ( 参 
见 1.6 节 ) 用 这 些 特定 的 特征 产生 这 些 ping 分 组 ， 所 以 设计 出 该 特征 来 检测 nmap 的 ping 
扫描 。 当 某 分 组 匹配 该 特征 时 ，Snort 产生 一 个 包括 “ICMP PING NAMP” 报 文 的 告警 。 

也 许 关 于 Snort 印象 最 为 深刻 的 是 巨大 的 用 户 社 区 和 维护 其 特征 数据 库 的 安全 专家 。 通 
常 在 一 个 新 攻击 出 现 后 的 几 个 小 时 内 ，Snort 社区 就 编写 并 发 布 一 个 攻击 特征 ， 然 后 它 就 能 被 
分 布 在 全 世界 的 数 十 万 Snot 部 署 者 下 载 。 此 外 ， 使 用 Snort 特征 的 语法 ， 网 络 管理 员 能 够 根 
据 他 们 自己 的 机 构 需 求 ， 通 过 修改 现 有 的 特征 或 通过 创建 全 新 的 特征 来 裁剪 某 个 特征 。 


8.10 小结 


在 本 章 中 ， 我 们 考察 了 秘密 情人 Bob 和 Alice 能 够 用 于 安全 通信 的 各 种 机 制 。 我 们 看 
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到 Bob 和 Alice 对 下 列 因素 感 兴趣 : 机 密 性 (因此 只 有 他 们 才能 理解 传输 的 报 文 内 容 ) 、 端 
点 鉴别 (因此 他 们 确信 正在 与 对 方 交谈 ) 和 报 文 完 整 性 (因此 他 们 确信 在 传输 过 程 中 他 
们 的 报 文 未 被 算 改 ) 。 当 然 ， 安 全 通信 的 需求 并 不 限于 秘密 情人 。 的 确 ， 我 们 在 8.5 ~8.8 
节 中 看 到 ， 可 以 在 网 络 体系 结构 中 的 各 个 层次 使 用 安全 性 ， 使 之 免 受 采用 各 种 各 样 攻击 手 
段 的 坏 家 伙 们 的 侵扰 。 

本 章 前 面部 分 给 出 了 安全 通信 所 依赖 的 各 种 原理 。 在 8. 2 节 中 ， 我们 涉及 了 加 密 和 人 解 
密 数据 的 密码 技术 ， 包 括 对 称 密 钥 密码 和 公开 密 钥 密 码 。 作 为 今天 网 络 中 两 种 重要 的 密码 
技术 的 特定 的 学 习 案 例 ， 我 们 考察 了 DES 和 RSA, 

在 8.3 节 中 ， 我们 研究 了 提供 报 文 完整 性 的 两 种 方法 : 报 文 鉴别 码 (MAC) 和 数字 签 
名 。 这 两 种 方法 有 一 些 共 同 之 处 。 它 们 都 使 用 了 密码 散 列 也 数 ， 这 两 种 技术 都 使 我 们 能 够 
验证 报 文 的 源 以 及 报 文 自身 的 完整 性 。 一 个 重要 的 差异 是 MAC 不 依赖 于 加 密 ， 而 数字 签 
名 要 求 公 钥 基础 设施 。 如 我 们 在 8. 5 ~8.8 节 所 见 ， 这 两 种 技术 广泛 在 实际 中 都 得 到 了 广 
泛 应 有 用。 此外， 数字 签名 用 于 生成 数字 证 书 ， 数 字 证 书 对 于 证 实 公 钥 的 合法 性 是 重要 的 。 
在 8.4 节 中 ， 我 们 考察 了 端点 鉴别 并 引入 了 不 重 数 以 防御 重 放 攻 击 。 

在 8.5 ~8.8 节 中 ， 我 们 研究 了 几 种 在 实践 中 得 到 广泛 使 用 的 安全 性 网 络 协议 。 我 们 
看 到 了 对 称 密 钥 密码 在 PCP、SSL、IPsec 和 无 线 安全 性 中 的 核心 地 位 。 我 们 看 到 了 公开 密 : 
钥 密码 对 PCP 和 SSL 是 至 关 重 要 的 。 我 们 看 到 PCP 使 用 数字 签名 而 SSL 和 IPsec 使 用 MAC 
来 保证 报 文 完整 性 。 在 目前 理解 了 密码 学 的 基本 原理 以 及 学 习 了 这 些 原理 的 实际 应 用 方法 
之 后 ， 你 现在 已 经 有 能 力 设计 你 自己 的 安全 网 络 协议 了 ! 

利用 8. 2 ~8.4 节 所 包含 的 技术 ，Bob 和 Alice 就 能 够 安全 通信 了 。 (只 希望 他 们 是 学 
习 了 这 些 材料 的 网 络 专业 学 生 ， 因 此 能 够 使 他 们 的 约会 不 会 被 Trudy AHL!) 而 机 密 性 仅 
是 整个 网 络 安全 的 一 小 部 分 。 如 我 们 在 8.9 节 中 所 学 习 ， 现 在 网 络 安 全 的 焦点 越 来 越 多 地 
关注 网 络 基础 设施 的 安全 性 ， 以 防止 “ 坏 家 伙 ” 的 潜在 猛烈 攻击 。 在 本 章 的 后 面部 分 ,我 
们 因此 学 习 了 防火 墙 和 IDS 系统 ， 它 们 检查 进入 和 离开 一 个 机 构 网 络 的 分 组 。 

本 章 已 经 涉及 了 许多 基础 性 问题 ， 同 时 关注 了 现代 网 络 安全 性 中 最 为 重要 的 主题 。 升 
望 深 入 钻研 的 读者 最 好 研究 本 章 中 引用 的 文献 。 特 别 是 ,我 们 推荐 以 下 读物 : 关于 攻击 和 
运行 安全 性 的 【Skoudis 2006 ] ， 关 于 密码 学 及 其 如 何 应 用 于 网 络 安全 的 [ Kaufman 1995], 
有 深度 且 可 读 性 强 的 关于 SSL 处 理 的 [Rescorla 2001 ] ， 以 及 透彻 地 讨论 802. 11 安全 性 且 
包括 对 WEP 及 其 缺陷 的 深入 研究 的 [Edney 2003 | 。 


课 后 习题 和 问题 





8.15 

R1. 报 文 机 密 性 和 报 文 完 整 性 之 间 的 区 别 是 什么 ? 你 能 具有 机 密 性 而 没有 完整 性 吗 ?你 能 具有 完整 性 而 
没有 机 密 性 吗 ? 证 实 你 的 答案 。 

R2. 因特网 实体 〈 路 由 器 、 交 换 机 、DNS 服务 器 、Web 服务 器 、 用 户 端 系统 等 ) 经 常 需要 安全 通信 。 给 
出 三 个 特定 的 因特网 实体 对 的 例子 ， 它 们 要 安全 通信 。 

8.27 

R3. 从 服务 的 角度 ， 对 称 密 钥 系 统 和 公开 密 钥 系 统 之 间 一 个 重要 的 差异 是 什么 ? 

R4. 假定 某 人 侵 者 拥有 一 个 加 密 报 文 以 及 该 报 文 的 解密 版 本 。 这 个 人 侵 者 能 够 发 起 已 知 密 文 攻击 、 已 知 
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明文 攻击 和 选择 明文 攻击 吗 ? 
R5. 考虑 一 个 8 块 密码 。 这 个 密码 有 多 少 种 可 能 的 输入 块 ” 有 多 少 种 可 能 的 映射 ? 如 果 我 们 将 每 种 映射 
视 为 一 个 密 钥 ， 则 该 密码 具有 多 少 种 可 能 的 密 钥 ? 
R6. 假定 N 个 人 中 的 每 个 人 都 和 其 他 V- 1 个 人 使 用 对 称 密 钥 密码 通信 。 任 两 人 (Ci A) 之 间 的 所 有 通 
信 对 该 N 个 人 的 组 中 的 所 有 其 他 人 都 是 可 见 的 ， 且 该 组 中 的 其 他 人 都 不 应 当 能 够 解密 他 们 的 通信 。 
则 这 个 系统 总 共 需 要 多 少 个 密 钥 ”现在 假定 使 用 公开 密 钥 密码 。 此 时 需要 多 少 个 密 钥 ? 
R7. 假定 n=10000、a=10023 和 4b=10004。 请 你 使 用 等 同 的 模 算术 来 心算 (a: b) mod ms 
R8. 假设 你 要 通过 加 密 对 应 于 报 文 1010111 的 十 进 制 数 来 加 密 该 报 文 。 该 十 进 制 数 是 什么 ? 
8.3~8.4 节 
R9. 散 列 以 何 种 方式 提供 比 检验 和 (如 因特网 检验 和 ) 更 好 的 报 文 完整 性 检验 ? 
R10. 你 能 够 “解密 ” 某 报 文 的 散 列 来 得 到 初始 报 文 吗 ? 解释 你 的 答案 。 
R11. 考虑 MAC 算法 (图 8-9) 的 一 种 变形 算法 ， 其 中 发 送 方 发 送 (m, H(m) +s), 这 里 H(m) +s 是 
H(m) Als 的 级 联 。 该 变形 算法 有 缺陷 吗 ? 为 什么 ? 
R12. 一 个 签名 的 文档 是 可 鉴别 的 和 不 可 伪造 的 ， 其 含义 是 什么 ? 
R13. 公 钥 加 密 的 报 文 散 列 以 何 种 方式 比 使 用 公 钥 加 密 报 文 提供 更 好 的 数字 签名 ? 
R14. 假设 certifier. com 生成 一 个 用 于 foo. com 的 证 书 。 通 常 整个 证 书 将 用 certifier. com 的 公 钥 加 密 。 这 种 
说 法 是 正确 还 是 错误 ? 
R15. 假设 Alice 有 一 个 准备 发 送 给 任何 请 求 者 的 报 文 。 数 以 千 计 的 人 要 获得 Alice 的 报 文 ， 但 每 个 人 都 要 
确保 该 报 文 的 完整 性 。 在 这 种 场景 下 ， 你 认为 是 基于 MAC 还 是 基于 数字 签名 的 完整 性 方案 更 为 适 
合 ? 为 什么 ? 
R16. 在 某 端 点 鉴别 协议 中 ， 使 用 不 重 数 的 目的 是 什么 ? 
R17. 我 们 说 一 个 不 重 数 是 一 个 在 生存 期 中 只 使 用 一 次 的 值 ， 这 意味 着 什么 ”其 中 是 指 谁 的 生存 期 ? 
R18. 基于 HMAC 的 报 文 完整 性 方案 易 受 重 放 攻击 影响 吗 ? 如 果 是 ， 能 够 在 方案 中 综合 一 个 不 重 数 来 去 除 
这 种 脆弱 性 吗 ? 
8.5~8.8 节 
R19. 假定 Bob 从 Alice 处 接收 一 个 PGP 报 文 。Bob 怎样 才能 确定 Alice (而 不 是 如 Trmdy) 生成 了 该 报 文 ? 
| PGP 为 保证 报 文 完整 性 使 用 了 MAC 吗 ? 
R20. 在 SSL 记录 中 ， 有 一 个 字段 用 于 SSL 序号 。 这 种 说 法 是 正确 还 是 错误 ? 
R21. 在 SSL 握手 中 随机 不 重 数 的 目的 是 什么 ? 
R22. 假设 某 SSL 会 话 应 用 了 具有 CBC 的 块 密码 。 服 务 器 以 明文 向 客户 发 送 了 IV。 这 种 说 法 是 正确 还 是 错误 ? 
R23. 假设 Bob 向 Trudy 发 起 一 条 TCP 连接 ， 而 Trudy 正在 伪装 她 是 Alice。 在 握手 期 间 ，Trudy 向 Bob 发 
送 Alice 的 证 书 。 在 SSL 握手 算法 的 哪 一 步 ，Bob 将 发 现 他 没有 与 Alice 通信 ? 
R24. 考虑 使 用 IPsec 从 主机 A 向 主机 B 发 送 分 组 流 。 通 常 ， 为 该 流 中 的 每 个 发 送 分 组 将 创建 一 个 新 SA. 
这 种 说 法 是 正确 还 是 错误 ? 
R25. 假设 在 图 8-28 中 总 部 和 分 支 机 构 之 间 通 过 IPsec 运行 TCP。 如 果 TCP 重新 传输 相同 的 分 组 ， 则 由 
RI 发 送 的 两 个 对 应 的 分 组 将 在 ESP 首部 中 具有 相同 的 序号 。 这 种 说 法 是 正确 还 是 错误 ? 
R26. IKE SA 和 IPsec SA 是 相同 的 东西 。 这 种 说 法 是 正确 还 是 错误 ? 
R27. 考虑 802. 11 的 WEP。 假 定数 据 是 10101100 并 且 密 钥 流 是 11110000。 相 应 的 密 文 是 什么 ? 
R28. 在 WEP 中 ， 在 每 个 帧 中 以 明文 发 送 IV。 这 种 说 法 是 正确 还 是 错误 ? 
8.9 节 
R29. 状态 分 组 过 滤器 维护 两 个 数据 结构 。 给 出 它们 的 名 字 并 简单 地 讨论 它们 做 些 什么 。 
R30. 考虑 某 传统 的 (无 状态 的 ) 分 组 过 滤器 。 该 分 组 过 滤器 可 能 基于 TCP 标志 位 以 及 其 他 首部 字段 过 
滤 分 组 。 这 种 说 法 是 正确 还 是 错误 ? 
R31. 在 传统 的 分 组 过 滤器 中 ， 每 个 接口 能 够 具有 自己 的 访问 控制 表 。 这 种 说 法 是 正确 还 是 错误 ? 
R32. 为 什么 应 用 程序 网 关 必 须 与 分 组 过 滤器 协同 工作 才能 有 效 ? 
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R33. 基于 特征 的 IDS 和 IPS 检查 TCP 和 UDP 报 文 段 的 载荷 。 这 种 说 法 是 正确 还 是 错误 ? 


Fas 


Pl. 使 用 图 8-3 中 的 单 码 代替 密码 ， 加 密 报 文 “This is an easy problem”， 并 解密 报 文 “rmij'u uamu xyj”。 

P2. Trudy 使 用 了 已 知 明文 攻击 ， 其 中 她 知道 了 7 个 字母 的 〈 密 文 ， 明 文 ) 转换 对 ， 减 少 了 8.2.1 节 的 例 
子 中 将 被 检查 的 大 约 10” 数量 级 的 可 能 替换 的 数量 。 请 说 明之 。 

P3. 考虑 图 8-4 所 示 的 多 码 代 替 密 码 系 统 。 利 用 报 文 “The quick brown fox jumps over the lazy dogs” 得 到 
的 明文 编码 ， 选 择 明 文 攻击 足以 破解 所 有 报 文 吗 ”为 什么 ? 

P4. 考虑 图 8-5 中 显示 的 块 密码 。 假 设 每 个 块 密码 T, 只 是 反 转 了 8 个 输入 比特 的 次 序 (例如 ， 使 得 
11110000 变 为 00001111 ) 。 进 一 步 假设 64 比特 置 乱 函数 不 修改 任何 比特 (使 得 第 m 个 比特 的 输出 值 
等 于 第 m 个 比特 的 输入 值 ) o 
a. 对 于 n=3 和 初始 64 比特 输入 等 于 10100000 重复 了 8 次 ,输出 的 值 是 多 少 ? 

b. 重复 (a), 但 此 时 将 初始 64 比特 的 最 后 一 个 比特 从 0 变 为 1。 
c. 重复 (a) 和 (b) ， 但 此 时 假定 64 比特 的 置 乱 晒 数 反 转 了 64 比特 的 次 序 。 

P5. 考虑 图 8-5 中 的 块 密码 。 对 于 给 定 的 “ 密 钥 ”，Alice 和 Bob 将 需要 8 个 表 ， 每 张 表 8 比特 乘 以 8 H 
特 。 对 于 Alice (BK Bob) 来 说 ， 要 存储 所 有 8 张 表 ， 将 需要 多 少 比特 的 存储 器 ?这 个 数 如 何 与 一 个 
全 表 64 比特 的 块 密码 所 需 的 比特 数 进行 比较 ? 

P6. 考虑 在 表 8-1 中 的 3 比特 块 密码 。 假 定 明 文 是 100100100, 

a. 初始 假设 未 使 用 CBC。 生 成 的 密 文 是 什么 ? 

b. 假设 Trudy 嗅 探 该 密 文 。 假 设 她 知道 正在 应 用 无 CBC 的 一 个 3 比特 块 密码 (但 不 知道 特定 的 密 
码 )， 她 能 够 推测 到 什么 ? 

c. 现在 假设 使 用 CBC， 其 中 IV =111。 产 生 的 密 文 是 什么 ? 

P7. 如 题 : 

a. 使 用 RSA， 选 择 p =3 和 49=11， 和 采用 对 每 个 字母 独立 地 加 密 的 方法 加 密 短语 “dog”。 对 已 加 密 报 
文 应 用 解密 算法 恢复 出 原 报 文 。 

b. 重复 (a), ， 而 此 时 加 密 “dog” 作 为 一 个 报 文 m, 

P8. 考虑 具有 p=5 Filq =11 的 RSA, 

a. n 和 z 是 什么 ? 

b. 令 e 为 3。 为 什么 这 是 一 个 对 e 的 可 接受 的 选择 ? 

c. SK d 使 得 de=l (mod z) 和 aqw<160。 

d. 使 用 密 钥 (n, e) 加 密 报 文 m =8。 令 c 表示 对 应 的 密 文 。 显 示 所 有 工作 。 提 示 : 为 了 简化 计算 ， 
使 用 如 下 事实 。 

[(amodn): (b mod n) |modn = (a+ b)mod n 

PO. 在 这 个 习题 中 ， 我 们 探讨 Diffie- Hellman( DH) 公 钥 加 密 算法 ， 该 算法 允许 两 个 实体 协商 一 个 共享 的 
密 钥 。 该 DH 算法 利用 一 个 大 素数 p 和 男 一 个 小 于 p 的 大 数 g。p 和 8 都 是 公开 的 〈 因 此 攻击 者 将 知 
道 它们 )。 在 DH 中 ，Alice 和 Bob 每 人 分 别 独 立地 选择 秘密 密 钥 S, 和 Spo Alice 则 通过 将 g 提高 到 S, 
并 以 p 为 模 来 计算 她 的 公 钥 Tio XAU, Bob 则 通过 将 g 提高 到 Ss 并 以 p 为 模 来 计算 他 的 公 钥 Ts。 
此 后 Alice 和 Bob 经 过 因特网 交换 他 们 的 公 钥 。Alice 则 通过 将 7s 提高 到 S, 并 以 p 为 模 来 计算 出 共享 
密 钥 $。 类 似 地 ，Bob 则 通过 将 T, 提高 到 S, 并 以 p 为 模 来 计算 出 共享 密 钥 $ 。 

a. 证 明 在 一 般 情况 下 ，Alice 和 Bob 得 到 相同 的 对 称 密 钥 ， 即 证 明 S =5'。 

b. 对 于 p=11 Al g=2, (RE Alice 和 Bob 分 别 选 择 私 钥 $, =5 AS, =12, 计算 Alice 和 Bob 的 公 钥 T, 
和 Ts。 显示 所 有 计算 过 程 。 

c. 接着 (b) ， 现 在 计算 共享 对 称 密 钥 S。 显 示 所 有 计算 过 程 。 

d. 提供 一 个 时 序 图 ， 显 示 Diffie-Hellman 是 如 何 能 够 受到 中 间 人 攻击 的 。 该 时 序 图 应 当 具 有 3 条 垂直 
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线 ， 分 别 对 应 Alice, Bob 和 攻击 者 Trudy. 
假定 Alice 要 与 采用 对 称 密 钥 密 码 体制 的 Bob 使 用 一 个 会 话 密 钥 K 通信 。 在 8.2 节 中 ， 我 们 知道 了 
如 何 使 用 公开 密 钥 密码 从 Alice 向 Bob 分 发 该 会 话 密 钥 。 在 本 习题 中 ， 我 们 探讨 不 使 用 公开 密 钥 密 
码 而 使 用 一 个 密 钥 分 发 中 心 (KDC) 分 发 会 话 密 钥 的 方法 。KDC 是 一 个 与 每 个 注册 用 户 共享 独特 的 
秘密 对 称 密 钥 的 服务 器 。 对 于 Alice 和 Bob ME, Kroc 和 Ks.xnc 表示 了 这 些 密 钥 。 设 计 一 个 使 用 
KDC 向 Alice 和 Bob E Ks 的 方案 。 你 的 方案 应 当 使 用 三 种 报 文 来 分 发 会 话 密 钥 : 一 种 从 Alice 到 
KDC 的 报 文 ; 一 种 从 KDC 到 Alice 的 报 文 ; 最 后 一 种 是 从 Alice 到 Bob 的 报 文 。 第 一 种 报 文 为 
Kiroc(A4，B)。 使 用 标记 Kroes Keros S, ARIB 回答 下 列 问题 。 
a. 第 二 种 报 文 是 什么 ? 
b. 第 三 种 报 文 是 什么 ? 
计算 一 个 不 同 于 图 8-8 中 的 两 个 报 文 的 第 三 个 报 文 ， 使 该 报 文具 有 与 图 8-8 中 的 报 文 相同 的 检验 和 。 
假定 Alice 和 Bob 共享 两 个 秘密 密 钥 : 一 个 鉴别 密 钥 S 和 一 个 对 称 加 密 密 钥 S,. THEA 8-9, FZ 
提供 完整 性 和 机 密 性 。 
在 BitTorrent P2P 文件 分 发 协议 中 (参见 第 2 章 ) ， 种 子 将 文件 分 割 为 块 ， 并 且 对 等 方 彼此 重 分 发 这 
些 块 。 不 使 用 任何 保护 ， 一 个 攻击 者 能 够 容易 地 通过 假冒 善意 的 对 等 方 并 向 洪流 中 的 一 部 分 对 等 方 
发 送 假冒 块 来 实施 破坏 。 这 些 未 被 怀疑 的 对 等 方 则 重新 向 其 他 对 等 方 发送 这 些 假冒 块 ， 其 他 对 等 方 
则 将 再 次 向 甚至 更 多 的 对 等 方 重 新 分 发 这 些 假冒 块 。 因 此 ， 对 于 BitTorrent 来 说 ， 采 用 一 种 机 制 使 
对 等 方 能 验证 一 个 块 的 完整 性 ， 从 而 使 得 假冒 块 无 法 分 发 ， 这 是 至 关 重 要 的 。 假 设 当 某 对 等 方 加 入 
一 个 洪流 时 ， 它 初始 从 一 个 完全 受信 任 的 源 得 到 一 个 torrent 文件 。 描 述 允 许 对 等 方 验证 块 完整 性 
的 一 个 简单 的 方案 。 
OSPF 路 由 选择 协议 使 用 一 个 MAC 而 不 是 数字 签名 来 提供 报 文 完整 性 。 你 认为 选择 MAC 而 未 选择 
数字 签名 的 原因 是 什么 ? 
考虑 图 8-18 中 的 鉴别 协议 ， 其 中 Alice 向 Bob 鉴别 她 自己 ， 我 们 看 来 工作 正常 ( 即 我 们 没有 发 现 其 
中 有 缺陷 ) 。 现 在 假定 当 Alice 向 Bob 鉴别 她 自己 的 同时 ，Bob 必须 向 Alice 鉴别 他 自己 。 给 出 一 个 
情况 ， 此 时 Trudy 假装 是 Alice， 向 Bob 鉴别 她 自己 是 Alice。( 提 示 : 该 协议 运行 的 顺序 ， 鉴 别 过 程 
可 由 Trudy 或 Bob 发 起 ， 能 够 任意 地 交织 在 一 起 。 特 别 注意 Bob 和 Alice 将 使 用 不 重 数 这 样 一 个 事 
实 ， 如 果 不 小 心 的 话 ， 能 够 恶意 地 使 用 相同 的 不 重 数 。) 
一 个 自然 的 问题 是 我 们 能 否 使 用 一 个 不 重 数 的 公 钥 密码 来 解决 8.4 节 中 的 端点 鉴别 问题 。 考 虑 下 列 
自然 的 协议 : (DAlice 向 Bob 发 送 报 文 “I am Alice”; QBob 选择 一 个 不 重 数 并 将 其 发 送 给 Alice; 
G)Alice 使 用 她 的 私 铀 来 加 密 该 不 重 数 并 向 Bob 发 送 得 到 的 值 ;，(@Bob 对 接收 到 的 报 文 应 用 Alice 的 
公 钥 。 因 此 ，Bob 计算 R 并 鉴别 了 Alice, 
a. 画图 表示 这 个 协议 ， 使 用 本 书 中 应 用 的 公 钥 和 私 钥 的 标记 法 。 
b. 假定 未 使 用 证 书 。 描 述 Trudy 怎样 能 够 通过 拦截 Alice 的 报 文 ， 进 而 对 Bob 假装 她 是 Alice 而 成 为 
一 名 “中 间 人 ”。 
图 8-19 显示 了 Alice 必须 执行 PGP 的 操作 ， 以 提供 机 密 性 、 鉴 别 和 完整 性 。 图 示 出 当 Bob 接收 来 自 
Alice 的 包 时 必须 执行 的 对 应 操作 。 
假定 Alice 要 向 Bob 发 送 电 子 邮 件 。Bob 具有 一 个 公共 -私有 密 钥 对 (Ks ，Ks )， 并且 Alice 具有 
Bob 的 证 书 。 但 Alice 不 具有 公 钥 私 钥 对 。Alice 和 Bob (以 及 全 世界 ) 共享 相同 的 散 列 函数 H(，. ) 。 
a. 在 这 种 情况 下 ， 能 设计 一 种 方案 使 得 Bob 能 够 验证 Alice 创建 的 报 文 吗 ? 如 果 能 ， 用 方 框图 显示 
Alice 和 Bob 是 如 何 做 的 。 
b. 能 设计 一 个 对 从 Alice 向 Bob 发 送 的 报 文 提供 机 密 性 的 方案 吗 ? 如 果 能 ， 用 方块 图 显示 Alice 和 
Bob 是 如 何 做 的 。 
考虑 下 面 对 于 某 SSL 会 话 的 一 部 分 的 Wireshark 输出 。 
a. Wireshark 分 组 112 是 由 客户 还 是 由 服务 器 发 送 的 ? 
b. 服务 器 的 IP 地 址 和 端口 号 是 什么 ? 
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c. 假定 没有 丢 包 和 重 传 ， 由 客户 发 送 的 下 一 个 TCP 报 文 段 的 序号 将 是 什么 ? 

d. Wireshark 分 组 112 包含 了 多 少 个 SSL 记录 ? 

e 分 组 112 包含 了 一 个 主 密 钥 或 者 一 个 加 密 的 主 密 钥 吗 ? 或 者 两 者 都 不 是 ? 

f 假定 握手 类 型 字段 是 1 字 节 并 且 每 个 长 度 字段 是 3 字 节 ， 主 密 钥 (或 加 密 的 主 密 钥 ) 的 第 一 
最 后 一 个 字 节 的 值 是 什么 ? 

g 客户 加 密 的 握手 报 文 考虑 了 多 少 SSL 记录 ? 

h. 服务 器 加 密 的 握手 报 文 考虑 了 多 少 SSL 记录 ? 
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a Internet Protocòl, Src: 1287238:38.162 (128. 238.38. 162), Dst: 216.75.194;220 (216.75.194.220) 
二 ST Control Protocol, Src Port: 2271 (2271), Ost Port: https (443), Seq: 79, Ack: 2785, Len: 204 
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© SSLv3 Record Layer: Handshake Protocol: Client Key Exchange 
content Type: Handshake (22) 
Version: SSL 3.0 (0x0300) 
Length: 132 


Handshake Type: Client Key Exchange (16 
h: 128 
B SSLv3 Record Layer: Change Cipher spec Protocol: Change Cipher Spec | 
Content Type: Change Cipher Spec (20) 
version: SSL 3.0 (€0x0300) 


Length: 1 
Change Cipher Spec Message 
& SSLV3 Record Layer: Handshake Protocol: Encrypted Handshake Message 
ontent e: Handshake (22) 
version: SSL 3.0 (0x0300) 


Length: 56 
Handshake Protocol: Encrypted Handshake Message 
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( Wireshark 屏幕 截图 的 重印 获得 Wireshark 基金 会 的 许可 ) 


8.6.1 节 中 表明 ， 不 使 用 序号 ，Trudy (一 名 中 间 人 ) 能 够 在 一 个 SSL 会 话 中 通过 互 换 TCP 报 文 段 实 

施 破 坏 。Trudy 能 够 通过 删除 一 个 TCP 报 文 段 做 某 种 类 似 的 事情 吗 ? 在 该 删除 攻击 中 ， 她 需要 做 什 

么 才能 成 功 ? 它 将 具有 什么 影响 ? 

假定 Alice 和 Bob 通过 一 个 SSL 会 话 通 信 。 假 定 一 个 没有 任何 共享 密 钥 的 攻击 者 ， 在 某 分 组 流 中 插 

人 一 个 假冒 的 TCP 报 文 段 ， 该 报 文 段 具有 正确 的 TCP 检验 和 及 序号 (以 及 正确 的 IP 地址 和 端口 

号 )。 在 接收 侧 SSL 将 接受 该 假冒 分 组 并 传递 载荷 给 接收 应 用 程序 吗 ? 为 什么 ? 

下 列 是 有 关 图 8-28 的 判断 题 。 

a. 当 在 172. 16. 1/24 中 的 主机 向 一 台 Amazon. com 服务 器 发 送 一 个 数据 报时 ， 路 由 器 R1 将 使 用 
IPsec 加 密 该 数据 报 。 

b. 当 在 172. 16. 1/24 中 的 主机 向 在 172. 16. 2/24 中 的 主机 发 送 一 个 数据 报时 ， 路 由 器 RI 将 改变 该 
IP 数据 报 的 源 和 目的 地 址 。 

c 假定 在 172. 16. 1/24 中 的 主机 向 在 172. 16. 2/24 中 的 Web 服务 器 发 起 一 个 TCP 连接 。 作 为 此 次 连 
接 的 一 部 分 ,由 RI 发 送 的 所 有 数据 报 将 在 IPv4 首部 字段 最 左边 具有 协议 号 50, 

d. 考虑 从 在 172. 16. 1/24 中 的 主机 回 在 172. 16. 2/24 中 的 主机 发 送 一 个 TCP 报 文 段 。 假 定 对 该 报 文 段 的 应 
答 丢 失 了 ， 因 此 TCP 重新 发 送 该 报 文 段 。 因 为 IPsec 使 用 序号 ，R1 将 不 重新 发 送 该 TCP 报 文 段 。 

考虑 图 8-28 中 的 例子 。 假 定 Trudy 是 中 间 人 ， 她 能 够 在 从 RI 和 R2 发 出 的 数据 报 流 中 插入 数据 报 。 
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作为 重 放 攻 击 一 部 分 ，Trudy 发 送 一 个 从 RI 到 R2 发 送 的 数据 报 的 元 余 副本 。R2 将 解密 该 元 余 的 数 

据 报 并 将 其 转发 进 分 支 机 构 网 络 吗 ”如 果 不 是 ,详细 描述 R2 如 何 检测 该 元 余 的 数据 报 。 

P24. 考虑 下 列 伪 WEP 协议 。 其 密 钥 是 4 比特 ,IV 是 2 比特 。 当 产生 密 钥 流 时 ，IV 被 附加 到 密 钥 的 后 面 。 
假定 共享 的 密 钥 是 1010。 密 钥 流 的 4 个 可 能 输入 如 下 : 

101000; 0010101101010101001011010100100--- 

101001: 1010011011001010110100100101101--- 

101010; 0001101000111100010100101001111--- 

101011; 1111101010000000101010100010111--- 

假定 所 有 报 文 都 是 8 比特 长 。 假 定 ICV (完整 性 检查 ) 是 4 比特 长 ， 并 且 通 过 用 数据 的 后 4 比特 异 

或 数据 的 前 4 比特 来 计算 。 假 定 该 伪 WEP 分 组 由 3 个 字段 组 成 : 首先 是 IV 字段 ， 然 后 是 报 文字 段 ， 

最 后 是 ICV 字段 ， 这 些 字段 中 的 某 些 被 加 密 。 

a. 我 们 希望 使 用 IV =11 和 WEP 发 送 报 文 m = 10100000, EX 3 个 WEP 字段 中 将 有 什么 样 的 值 ? 

b. 说 明 当 接收 方 解 密 该 WEP 分 组 时 ， 它 恢复 报 文 和 ICV。 

c. 假定 Trudy 截获 了 一 个 WEP 分 组 (并 不 必要 使 用 IV =11) 并 要 在 向 接收 方 转发 前 修改 该 分 组 。 
假定 Trudy 翻转 了 第 一 个 ICV 比特 。 假 定 Trudy 并 不 知道 用 于 任何 IV 的 密 钥 流 ， 则 Trudy 也 必须 
翻转 哪些 其 他 比特 ,使 得 接收 到 的 分 组 通过 ICV 检查 ? 

d. 通过 修改 (a) 中 WEP 分 组 中 的 比特 ， 解 密 所 生成 的 分 组 ， 并 验证 完整 性 检查 来 评价 你 的 答案 。 

P25. 对 于 尽 可 能 限制 但 能 实现 下 列 功能 的 一 台 有 状态 防火 墙 ， 提 供 一 张 过 滤器 表 和 一 张 连接 表 : 

a. 允许 所 有 的 内 部 用 户 与 外 部 用 户 创 建 Telnet 会 话 。 

b. 允许 外 部 用 户 冲 浪 公司 位 于 222. 22. 0. 12 的 Web 站 点 。 

c. 否则 阻挡 所 有 入 流量 和 出 流量 。 

内 部 网 络 为 222. 22/16。 在 你 的 答案 中 ,假设 连接 表 当 前 缓存 了 3 个 从 内 向 外 的 连接 。 你 需要 虚构 

适当 的 IP 地 址 和 端口 号 。 

P26. 假设 Alice 要 使 用 TOR 类 似 的 服务 访问 Web 站 点 activist. com。 该 服务 使 用 两 个 不 串通 的 代理 服务 器 
Proxy] 和 Proxy2。Alice 首先 从 某 个 中 央 服 务 器 获得 对 Proxyl 和 Proxy2 的 证 书 (每 个 都 包含 一 个 公 
H) MAKO KO KOAK) 表示 加 密 / 解 密 时 所 使 用 的 RSA AHA RSA 私 钥 。 

a. 使 用 一 幅 时 序 图 ， 提 供 一 个 〈 尽 可 能 简单 的 ) 协议 允许 Alice 创建 一 个 用 于 Proxyl 的 共享 会 话 密 
EH Sio S\(m) 表示 为 使 用 共享 密 钥 S 对 数据 m 加 密 / 解 密 。 

b. 使 用 时 序 图 ， 提 供 一 个 〈 尽 可 能 简单 的 ) 协议 允许 Alice 创建 一 个 对 于 Proxy2 的 共享 会 话 密 钥 
S,, Mi AI] Proxy2 透露 她 的 IP 地 址 。 

c 现在 假设 创建 了 共享 密 钥 S AS, 。 使 用 时 序 图 提供 一 个 协议 〈 尽 可 能 简单 并 且 不 使 用 公开 密 铀 
密码 ) ， 该 协议 允许 Alice 从 activist. com 请 求 一 个 html 页 面 而 不 向 Proxy2 透露 她 的 卫 地 址 ， 并 且 
不 向 Proxy] 透露 她 正在 访问 哪个 站 点 。 你 的 图 应 当 终 止 在 一 个 HTTP 请 求 到 达 activist. com, 
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在 这 个 实验 中 〈 与 本 书 配套 的 Web 站 点 有 可 用 资源 ) ， 我 们 研究 安全 套 接 层 (SSL) 协议 。8. 6 节 讲 
过 ,使 用 SSL 使 得 TCP 连接 更 为 安全 ， 为 了 使 因特网 事务 安全 ， 实 践 中 广泛 应 用 了 SSL。 在 本 实验 中 我 
们 关注 经 TCP 连接 发 送 的 SSL 记录 。 我 们 将 试图 对 每 个 记录 定 界 和 分 类 ， 目标 是 理解 每 个 记录 的 工作 原 
理 和 工作 过 程 。 我 们 研究 各 种 SSL 记录 类 型 以 及 在 SSL 报 文中 的 字段 。 通 过 分 析 你 的 主机 与 某 电 子 商 务 
服务 器 之 间 发 送 的 SSL 记录 的 踊 迹 来 做 这 些 事情 。 


四 IPsec 实验 


在 这 个 实验 中 (与 本 书 配套 的 Web 站 点 有 可 用 资源 ) ， 我 们 将 探讨 如 何在 linux 装置 之 间 创 建 IPsec 
SA。 你 能 够 用 两 个 普通 的 linux 装置 做 该 实验 的 第 一 部 分 ， 每 个 装置 配 有 一 块 以 太 网 适 配 占 。 但 是 对 于 实验 


的 第 二 部 分 ， 你 将 需要 4 个 linux 装置 ， 这 些 装 置 每 个 都 具有 两 块 以 太 网 适配器 。 在 该 实验 的 第 二 部 分 ， 你 
将 在 隧道 模式 中 使 用 ESP 协议 创建 IPsec SA。 你 做 实验 过 程 是 : 先 人 工 创 建 SA， 然 后 让 IKE 创建 SA。 


| 人 物 专 访 


Steven M. Bellovin 在 位 于 新 泽 西 州 了 lorham Park 的 AT&T 实验 研究 所 的 
网 络 服务 研究 实验 室 工 作 多 年 后 ， 成 为 哥伦比亚 大 学 的 教师 。 他 的 研究 重 
点 是 网 络 和 安全 ， 以 及 将 两 者 有 机 结合 起 来 。1995 年 ， 因 创立 了 Usenet， 
即 第 一 个 连接 两 个 或 多 个 计算 机 并 允许 用 户 共享 信息 和 参与 讨论 的 新 闻 组 
交换 网 络 ， 而 被 授予 Usenix 终生 成 就 奖 。Steven 也 是 国家 工程 学 会 的 当选 
成 员 。 他 获得 了 哥伦比亚 大 学 的 学 士 学 位 和 位 于 Chapel Hill 的 北 卡 罗 来 纳 
大 学 的 博士 学 位 。 





© 什么 原因 使 您 决定 专注 于 网 络 安全 领域 的 研究 ? 

听 起 来 可 能 很 奇怪 ， 但 是 答案 却 很 简单 : 只 是 因为 感 兴趣 而 已 。 我 以 前 的 
背景 是 从 事 系统 编程 和 系统 管理 ， 这 很 自然 就 发 展 到 安全 领域 了 。 而 且 我 一 直 对 通信 很 感 兴趣 ， 这 可 以 
追溯 到 我 还 在 上 大 学 时 ， 就 兼职 做 系统 编程 方面 的 工作 。 

我 在 安全 领域 的 工作 持续 受到 两 个 因素 的 激励 : 一 个 是 希望 计算 机 有 用 ， 这 意味 着 它们 的 功能 不 会 
被 攻击 者 破坏 ， 男 一 个 是 希望 保护 隐私 。 

© 当初 您 在 研发 Usenet 时 ， 您 对 它 的 愿景 是 什么 ? MWER? 

我 们 最 初 将 它 看 作 是 一 种 能 够 在 全 国 范围 内 讨论 计算 机 科学 和 计算 机 编程 的 手段 ， 考 虑 了 用 于 事务 
管理 和 广告 销售 等 目的 的 许多 本 地 使 用 情况 。 事 实 上 ， 我 最 初 的 预测 是 ， 每 天 从 至 多 50 ~ 100 个 站 点 有 
1 ~2 个 报 文 。 但 是 实际 增长 是 与 人 相关 的 主题 方面 ， 包 括 (但 不 限于 ) 人 与 计算 机 的 相互 作用 。 这 么 多 
年 来 ， 我 喜欢 的 新 闻 组 有 rec. woodworking 以 及 sci. crypt。 

在 某 种 程度 上 ， 网 络 新 闻 已 经 被 Web 取代 。 如 果 现 在 要 我 再 设计 它 的 话 ， 就 会 和 那 时 的 设计 大 不 相 
同 了 。 但 是 它 仍然 是 沟通 对 某 一 主题 感 兴趣 的 大 量 读者 的 一 种 极 好 手段 ， 而 不 必 依 赖 特定 的 Web 站 点 。 

© 是 否 有 人 给 过 您 专业 上 的 启示 和 灵感 ?以 什么 样 的 方式 呢 ? 

Fred Brooks 教授 对 我 的 专业 生涯 影响 重大 。 他 是 位 于 Chapel Hill 的 北 卡罗来纳 大 学 计算 机 科学 系 的 
创立 者 和 原 系 主任 ， 是 研发 IBM S/360 和 0S/360 团队 的 管理 者 。 他 也 是 “The Mythical Man Mouth” 
(《 人 月 神话 》) 的 作者 。 最 重要 的 是 ， 他 教 给 我 们 展望 和 折 中 的 方法 ， 即 如 何在 现实 世界 环境 中 观察 问 
题 (不 论 这 个 现实 世界 比 理论 上 的 要 复杂 多 少 倍 ) ， 以 及 在 设计 一 种 解决 方案 时 如 何平 衡 竞争 各 方 的 利 
益 。 大 部 分 计算 机 工作 都 是 工程 性 的 ， 正 确 折 中 的 艺术 能 够 满足 许多 相 了 矛盾 的 目标 。 

© 您 对 未 来 的 联网 和 安全 性 的 展望 是 什么 ? 

到 目前 为 止 ， 我 们 所 具有 的 安全 性 大 多 来 自 隔离。 例如， 防火 墙 的 工作 是 通过 切断 某 些 机 器 和 服务 
实现 的 。 但 是 我 们 正 处 在 增加 连通 性 的 时 代 ， 这 使 得 隔离 变 得 更 为 困难 。 更 糟糕 的 是 ， 我 们 的 生产 性 系 
统 要 求 的 远 不 止 是 分 离 的 部 件 ， 而 需要 通过 网 络 将 它们 互联 起 来 。 我 们 面临 的 最 大 挑战 之 一 是 使 所 有 都 
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© 您 认为 在 安全 性 方面 已 经 取得 的 最 大 进展 是 什么 ? 未 来 我 们 还 能 有 多 大 作为 ? 

至 少 从 科学 上 讲 ， 我 们 知道 了 密码 学 的 原理 。 这 是 非常 有 帮助 的 。 但 是 多 数 安 全 性 问题 因为 其 代码 
错误 成 堆 而 成 为 非常 困难 的 问题 。 事 实 上 ， 它 是 计算 机 科学 中 悬而未决 的 老 问 题 ， 并 且 我 认为 该 问题 仍 
会 持续 。 挑 战 在 于 弄 明白 : 当 我 们 不 得 不 使 用 不 安全 的 组 件 构建 安全 的 系统 时 ， 如 何 才能 让 系统 安全 。 
我 们 面 对 硬 件 故障 已 经 能 够 解决 可 靠 性 问题 了 ; 面 对 安 全 性 问题 ， 我 们 是 否 能 够 做 到 这 一 点 呢 ? 

© 您 对 进入 因特网 和 网 络 安全 领域 的 学 生 有 什么 忠告 吗 ? 

学 习 各 种 安全 机 制 是 件 容易 的 事 。 学 习 如 何 “ 思 维 多 疑 ” 是 困难 的 。 你 必须 记 住 概率 分 布 在 下 列 场 
合并 不 适用 ， 即 攻击 者 能 够 发 现 不 可 能 的 情况 。 细 节 情 况 不 胜 枚 举 。 


Steven M. Bellovin 


| 第 9 音 


Computer Networking; A Top-Down Approach, Seventh Edition 


多 媒体 网 络 





位 于 世界 各 个 角落 的 人 们 懒散 地 靠 坐 在 床上 或 乘坐 公共 汽车 和 地 铁 打 发 时 间 时 ， 眼 下 
都 使 用 因特网 来 按 需 观看 电影 和 电视 节目 。 因 特 网 电影 和 电视 分 发 公司 (如 北美 的 Netflix 
FI Amazon, PEHÉ “AE” (Youku) A “AA” (Kankan) ) 实际 上 已 经 成 为 家 喻 户 晓 
的 品牌 。 而 人 们 不 仅 观看 因特网 视频 ， 他 们 也 使 用 诸如 YouTube 这 样 的 站 点 来 上 载 和 分 发 
用 户 自己 生成 的 内 容 ， 不 仅 成 为 因特网 视频 的 消费 者 ， 也 成 为 视频 的 生产 者 。 此 外 ， 网 络 应 
用 如 Skype, Google Talk 和 微 信 (WeChat 在 中 国 极为 流行 )， 不 仅 允 许 人 们 经 过 因特网 打 
“电话 ”， 而 且 可 以 用 视频 和 多 方 会 议 来 强化 这 些 电话 。 事 实 上 ， 我 们 能 够 确定 地 预测 : 到 当 
前 年 代 未 ， 几 乎 所 有 的 视频 消费 和 语音 会 话 都 将 在 因特网 的 端 到 端 发 生 ， 通 常 更 多 是 以 无 线 
终端 方式 经 蜂窝 和 WiFi 接 入 网 与 因特网 相连 接 。 传 统 的 电话 和 广播 电视 正 快速 落伍 。 

本 章 以 9. 1 节 中 的 多 媒体 应 用 的 分 类 方法 开始 。 我 们 将 看 到 多 媒体 应 用 能 够 分 为 流 式 
存储 音频 /视频 、 会 话 式 IP 音频 /视频 或 流 式 实况 音频 /视频 等 几 类 。 我 们 将 看 到 这 些 应 用 
类 型 中 的 每 一 类 都 有 自己 独特 的 服务 需求 ， 这 些 需 求 与 传统 的 弹性 应 用 如 电子 邮件 、Web 
浏览 和 远程 注册 的 需求 差异 很 大 。 在 9. 2 节 中 ， 我 们 较为 详细 地 研究 流 式 视 频 。 我 们 将 探 
讨 支 撑 流 式 视频 的 许多 基础 原则 ， 包 括 客户 缓存 、 预 取 和 对 可 用 种 宽 的 适应 性 视频 质量 。 
在 9.3 节 中 ,我们 研究 会 话 式 语 音 和 视频 。 这 种 应 用 不 同 于 弹性 应 用 ， 对 端 到 端 时 延 高 度 
敏感 ， 但 能 够 容忍 偶尔 的 数据 丢失 。 此 时 我 们 将 研究 诸如 适应 性 播放 、 前 向 纠 错 和 差错 掩 
盖 等 技术 是 如 何 减 缓 网 络 引 入 的 丢 包 和 时 延 的 。 我 们 还 将 以 学 习 案例 方式 审查 Skype。 在 
9.4 节 中 ， 我 们 将 学 习 RTP 和 SIP， 这 是 两 个 用 于 实时 会 话 式 语音 和 视频 应 用 的 协议 。 在 
9.5 节 中 ， 我 们 将 研究 网 络 内 部 的 一 些 机 制 ， 这 些 机 制 能 用 于 区 分 一 类 流量 ( 如 会 话 式 语 
音 这 样 的 时 延 敏 感应 用 ) 和 其 他 类 型 流量 (如 浏览 Web 网 页 这 样 的 弹性 应 用 ) ， 并 且 在 多 
类 流量 中 提供 区 分 服务 。 


9.1 多 媒体 网 络 应 用 


我 们 将 多 媒体 网 络 应 用 定义 为 任何 应 用 音频 或 视频 的 网 络 应 用 。 在 本 节 中 ， 我们 将 提 
供 多 媒体 应 用 的 分 类 法 。 我 们 将 看 到 在 该 分 类 法 中 的 每 类 应 用 都 具有 自己 独特 的 服务 要 求 
和 设计 问题 集合 。 但 在 深入 讨论 因特网 多 媒体 应 用 前 ， 考 虑 音频 和 视频 媒体 自身 的 内 在 特 
点 是 有 用 的 。 


9.1.1 视频 的 性 质 


视频 最 为 显 闭 的 特点 或 许 是 它 的 高 比特 率 (high bit rate) 。 经 因特网 分 发 的 视频 的 典 
型 传输 速率 从 用 于 低 质 量 视频 会 议 的 100kbps 到 用 于 流 式 高 分 辨 率 电影 的 3Mbps。 为 了 比 
较 视频 带宽 需求 与 其 他 因特网 应 用 的 带宽 需求 的 不 同 ， 我 们 简要 地 考虑 三 个 不 同 的 用 户 ， 
他 们 每 人 使 用 了 一 种 不 同 的 因特网 应 用 。 第 一 位 用 户 Frank， 他 打算 迅速 将 照片 张贴 到 他 
的 朋友 的 脸 书 页 面 上 。 我 们 假设 Frank 每 10 秒 查找 一 次 新 上 照片， 并且 这 些 照片 的 平均 大 小 
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fz 200KB, (与 以 前 一 样 ， 我 们 在 整个 讨论 中 都 简单 地 假定 1KB = 8000 比特 。) 第 二 位 用 
户 Martha 正 从 因特网 (“ZP”) 向 她 的 智能 手机 流 式 传输 音乐 。 我 们 假定 Martha 正在 听 
许多 MP3 歌曲 ， 一 首 接着 一 首 ， 都 以 128kbps 速率 进行 编码 。 第 三 位 用 户 Victor 则 正在 观 
看 以 2Mbps 编码 的 视频 。 最 后 ， 我 们 假设 所 有 三 位 用 户 的 会 话 长 度 是 4000 秒 (大 约 67 分 
钟 )。 表 9-1 比较 了 这 三 位 用 户 的 比特 率 和 传输 的 总 字 节 。 我 们 看 到 这 时 流 式 视频 消耗 了 
最 多 的 带宽 ， 其 比特 率 比 脸 书 和 流 式 音乐 应 

用 的 带宽 大 10 倍 。 因 此 ， 当 设计 网 络 视频 表 9-1 三 种 因特网 应 用 的 比特 率 需求 的 比较 
应 用 时 ， 我 们 心中 必须 记 住 的 第 一 件 事 是 视 aa 
频 的 高 比特 率 需 求 。 鉴 于 视频 的 流行 性 及 其 
高 比特 率 ， 也 许 不 会 对 思科 公司 的 以 下 预测 
感到 惊讶 [Cisco 2015]: 到 了 2019 Æ, Ñi 

式 视 频 和 存储 视频 将 大 约 占 全 球 因特网 流量 消费 的 90% 。 

视频 的 另 一 种 重要 特点 是 它 能 被 压缩 ， 因 而 要 在 视频 质量 与 比特 率 间 进行 折 中 。 视 频 
是 一 个 图 像 序列 ， 图 像 通常 以 恒定 的 速率 显示 ， 例 如 每 秒 24 幅 或 30 幅 图 像 。 一 个 没有 压 
缩 、 数 字 编码 的 图 像 由 像素 阵列 组 成 ， 每 个 像素 被 编码 为 一 定数 量 的 比特 来 表示 亮度 和 颜 
色 。 在 视频 中 有 两 种 类 型 的 元 余 ， 它 们 都 可 以 用 来 进行 视频 压缩 (video compression), 2 
间 兄 余 是 给 定 图 像 的 内 部 元 余 。 从 直觉 上 讲 ， 一 个 主要 由 空白 组 成 的 图 像 具 有 高 度 的 宛 
余 ， 能 够 有 效 地 压缩 而 不 会 明显 降低 图 像 质量 。 时 域 宛 余 反映 一 幅 图 像 和 后 续 图 像 的 重复 
程度 。 例 如 ， 如 果 一 幅 图 像 和 后 续 图 像 完 全 一 致 ， 没 有 理由 对 后 续 图 像 再 进行 编码 ; 相 
反 ， 在 编码 过 程 中 直接 指出 后 续 图 像 是 完全 一 样 的 则 更 为 有 效 。 今 天 现成 的 压缩 算法 能 够 
将 视频 压缩 为 所 希望 的 任何 基本 比特 率 。 当 然 ， 比 特 率 越 高 ， 图 像 质量 越 好 ， 总 体 用 户 视 
觉 体验 也 越 好 。 

我 们 也 能 够 使 用 压缩 来 生成 相同 视频 的 多 重 版 本 (multiple version) ， 每 个 版 本 有 不 同 
的 质量 等 级 。 例 如 ， 我 们 能 够 使 用 压缩 生成 相同 视频 的 三 个 版 本 ， 速 率 分 别 为 300kbps、 
1Mbps 和 3Mbps。 用 户 则 能 够 根据 他 们 的 当前 可 用 带宽 来 决定 要 观看 哪个 版 本 。 具 有 高 速 
因特网 连接 的 用 户 可 以 选择 3Mbps 的 版 本 ; 使 用 智能 手机 经 过 3G 观看 视频 的 用 户 可 以 选 
择 300kbps 的 版 本 。 类 似 地 ， 在 视频 会 议 应 用 中 的 视频 能 被 “动态 ”( on-the-fty) 地 压缩 ， 
以 在 会 话 用 户 之 间 给 定 的 可 用 端 到 端 带宽 上 提供 最 好 的 视频 质量 。 


9. 1.2 音频 的 性 质 


数字 音频 (包括 数字 化 语音 和 音乐 ) 的 带宽 需求 比 视频 低 得 多 。 然 而 ， 数 字音 频 具 有 
自己 独特 的 性 质 ， 当 设计 多 媒体 应 用 时 必须 考虑 这 些 性 质 。 为 了 理解 这 些 性 质 ， 我 们 首先 
考虑 模拟 音频 〈 由 人 和 乐器 所 产生 ) 是 如 何 转换 为 数字 信和 号 的 : 

。 模拟 音频 信号 首先 以 某 种 固定 速率 采样 ， 例 如 每 秒 8000 个 样本 。 每 个 采样 值 是 一 

个 任意 的 实数 。 
。 然后 每 个 采样 值 被 “四 舍 五 人 ”为 有 限 个 数值 中 的 一 个 。 这 种 操作 被 称 为 量化 
(quantization) 。 这 些 有 限 个 数值 〈 称 为 量化 值 ) 通常 是 2 WE, BiG 256 个 量化 值 。 
。 每 个 量化 值 由 固定 数量 的 比特 表示 。 例 如 ， 如 果 有 256 个 量化 值 ， 那 么 每 个 值 
(因此 每 个 音频 采样 ) 用 一 个 字 节 来 表示 。 所 有 样本 的 比特 表示 级 联 在 一 起 就 形成 
了 该 信号 的 数字 表示 。 举 例 来 说 ， 如 果 一 个 模拟 信号 以 每 秒 8000 个 样 值 采 样 ， 而 
且 每 个 样本 被 量化 并 用 8 比特 表示 ， 则 得 到 的 数字 信号 的 速率 就 为 每 秒 64 000 比 
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特 。 通 过 音频 扬声器 播放 ， 这 个 数字 信号 则 能 够 转换 回来 〈 也 就 是 解码 ) ， 形 成 一 
个 模拟 信号 。 然 而 ， 解 码 后 的 模拟 信号 仅 是 初始 信号 的 近似 ， 并 且 声 音质 量 也 许 
有 明显 的 下 降 〈 例 如 ， 高 频 的 声音 可 能 在 解码 信号 中 丢失 了 ) 。 通 过 增加 采样 速率 
和 量化 值 的 数量 ， 解 码 信号 能 够 更 好 地 接近 初始 的 模拟 信号 。 因 此 (与 视频 一 
样 ) ， 在 解码 信号 的 质量 和 比特 率 与 数字 信和 号 存储 空间 之 间 存 在 一 种 折 中 。 
我 们 刚才 描述 的 基本 编码 技术 称 为 脉冲 编码 调制 ( Pulse Code Modulation, PCM), if 
音 编码 通常 采用 PCM， 采 样 速率 为 每 秒 8000 个 样本 ， 每 个 样本 用 8 比特 表示 ， 得 到 
64kbps 的 速率 。 音 频 光 盘 (CD) 也 使 用 PCM， 采 样 速率 为 每 秒 44 100 个 样本 ， 每 个 样本 
用 16 比特 表示 ; 这 样 使 得 单 声 道 速率 为 705. 6kbps， 立 体 声速 率 为 1. 411Mbps。 
然而 ，PCM 编码 的 语音 和 音乐 很 少 在 因特网 中 使 用 。 与 视频 一 样 ， 取 而 代 之 的 是 使 用 
压缩 技术 来 减 小 流 的 比特 速率 。 人 类 语音 能 被 压缩 到 小 于 10kbps 并 仍然 可 懂 。 一 种 接近 
CD 质量 立体 声音 乐 的 流行 压缩 技术 是 MPEG 1 第 3 层 ， 更 通常 的 叫 法 是 MP3。MP3 编码 
器 通常 能 够 压缩 为 许多 不 同 的 速率 ; 128kbps 是 最 常 使 用 的 编码 速率 ， 并 且 能 够 产生 非常 
小 的 声音 失真 。 一 种 相关 的 标准 是 高 级 音频 编码 (Advanced Audio Coding，AAC) ， 该 标准 
已 经 随 苹 果 公 司 而 流行 起 来 。 与 视频 一 样 ， 能 够 以 不 同 的 比特 率 生 成 多 重 版 本 的 预先 录制 
的 音频 流 。 
尽管 音频 比特 率 通 常 比 视频 的 比特 率 小 得 多 ,但 用 户 通 常 对 音频 的 小 失误 比 视频 的 小 
失误 更 为 敏感 。 例 如 ， 考 虑 在 因特网 上 举行 的 视频 会 议 。 如 果 视 频 信 号 时 不 时 地 丢失 几 
秒 ， 该 视频 会 议 很 可 能 继续 进行 而 没有 太 多 的 用 户 抱怨 。 然 而 ， 如 果 音 频 信和 号 经 常 丢 失 ， 
用 户 就 可 能 不 得 不 中 止 该 会 话 。 


9. 1.3 多 媒体 网 络 应 用 的 类 型 


因特网 能 够 支持 各 种 各 样 有 用 的 和 娱乐 性 的 多 媒体 应 用 。 在 本 小 节 中 ， 我 们 将 多 媒体 应 
用 分 为 三 个 大 类 : OFA MA, @ 会 话 式 卫 语音 /视频 ; @ 流 式 实况 音频 /视频 。 
如 我 们 很 快 将 看 到 的 那样 ， 这 些 应 用 类 型 中 的 每 种 都 有 自己 的 服务 需求 和 设计 问题 的 集合 。 
1. 流 式 存 储 音 频 和 视频 


为 使 讨论 具体 化 ， 我 们 这 里 聚焦 流 式 存 储 视 频 ， 它 通常 结合 了 视频 和 音频 组 件 。 流 式 

存储 音频 (例如 流 式 音 乐 ) 非常 类 似 于 流 式 存 储 视 频 ， 尽 管 它 的 比特 率 通 常 要 低 得 多 。 

在 这 类 应 用 中 ， 依 赖 的 媒体 是 预先 录制 的 视频 ( 如 电影 、 电 视 节 目 ) 预先 录制 的 体育 

赛事 或 预先 录制 的 用 户 生成 的 视频 (如常 在 YouTube 上 看 到 的 那些 ) 。 这 些 预 先 录制 的 视 
频 放 置 在 服务 器 上 ， 用 户 向 服务 器 发 送 请 求 按 需 观 看 视频 。 许 多 因特网 公司 今天 提供 流 式 
视频 ， 包 括 YouTube (谷歌 ) Netflix, Amazon 和 Hulu。 流 式 存 储 视频 具有 三 个 关键 的 不 
同 特 色 。 

。 流 。 在 流 式 存 储 视频 应 用 中 ， 客 户 开 始 从 服务 器 接收 文件 几 秒 之 后 ， 通 常 就 开始 
播放 视频 。 这 意味 着 当 客 户 正 在 从 视频 的 一 个 位 置 开 始 播放 时 ， 与 此 同时 正在 从 
服务 器 接收 该 视频 的 后 续 部 分 。 这 种 技术 被 称 为 流 ( streaming) ， 它 避免 了 在 开始 
播放 之 前 必须 下 载 整个 视频 (并且 引起 一 个 潜在 的 长 时 延 ) 。 

e 相互 作用 。 因 为 媒体 是 预先 录制 的 ， 用 户 可 以 对 多 媒体 内 容 进行 暂停 、 重 新 配置 
前 进 、 重 新 配置 倒退 、 快 进 等 操作 。 从 一 个 客户 提出 这 种 请 求 到 该 动作 在 客户 端 
表现 出 来 ， 可 接受 的 响应 时 间 应 该 小 于 几 秒 。 
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。 连续 播放 。 一 旦 视频 开始 播放 ， 它 应 该 根据 初始 记录 的 时 序 进行 。 因 此 ， 为 了 在 
客户 端 播放 ， 必 须 从 服务 器 中 及 时 接收 数据 ; 否则， 用 户 经 历 视 频 帧 停滞 (这 时 
客户 等 待 延 迟 的 帧 ) 或 帧 跳 过 (这 时 客户 漏 掉 延 迟 的 帧 ) 。 

到 目前 为 止 ， 对 流 式 视频 最 重要 的 性 能 测度 是 平均 吞吐 量 。 为 了 提供 连续 的 播放 ， 网 
络 为 流 式 应 用 提供 的 平均 吞吐 量 必须 至 少 与 该 流 视 频 本 身 的 比特 率 一 样 大 。 如 我 们 将 在 
9. 2 节 所 见 ， 通 过 使 用 缓存 和 预 取 ， 即 使 在 吞吐 量 波动 的 时 候 ， 提 供 连续 播放 也 是 可 能 
的 ， 只 要 平均 吞吐 量 (在 5 ~ 10 秒 区 间 平 均 ) 保持 在 视频 速率 之 上 [ Wang 2008]。 

对 于 许多 流 式 视 频 应 用 ， 预 先 录 制 的 视频 被 存储 起 来 ， 并 且 从 CDN 而 非 从 单一 的 数 
据 中 心 流 式 播放 。 也 有 许多 PP 视频 流 式 应 用 ， 其 中 视频 被 存储 在 用 户主 机 (对 等 方 ) 
上 ， 不 同 视频 块 从 可 能 分 布 在 全 球 的 不 同 对 等 方 到 达 。 在 得 知 了 因特网 流 式 视频 的 性 能 
后 ， 我 们 将 在 9. 2 节 更 加 深入 地 研究 流 式 视频 ， 特 别 关注 客户 缓存 、 预 取 、 对 可 用 带宽 的 
适应 性 质量 和 CDN 分 发 。 

2. 会 话 式 IP 语音 和 视频 

在 因特网 上 的 实时 会 话 式 语音 通常 称 为 因特网 电话 《Internet telephony) 因为 从 用 户 
的 角度 看 ， 它 类 似 于 传统 的 电路 交换 电话 服务 。 它 也 常 被 称 为 IP 语音 (Voice- over- IP, 
VoIP) 。 会 话 式 视频 与 之 类 似 ， 除 了 它 包括 参与 者 的 语音 以 及 视频 外 。 今 天 的 大 多 数 语 音 
和 视频 会 话 式 系统 允许 用 户 生成 具有 三 个 或 更 多 个 参与 者 的 会 议 。 会 话 式 语音 和 视频 广泛 
地 应 用 于 今天 的 因特网 中 ， 因 特 网 公司 Skype, QQ 和 Google Talk 自称 每 天 都 有 数 亿 用 户 。 

在 第 2 章 有 关 应 用 服务 需求 的 讨论 中 (图 2-4) ， 我 们 确定 了 一 些 轴 ， 服 务 需求 可 以 根 
据 它 们 分 类 。 其 中 的 两 个 轴 (〈 即 定时 考虑 和 数据 丢失 容忍 度 ) 对 会 话 式 语音 和 视频 应 用 尤 
其 重要 。 定 时 考虑 是 很 重要 的 ， 因 为 音频 和 视频 会 话 式 应 用 是 高 度 时 延 敏 感 ( delay- sensi- 
tive) 的 。 对 于 具有 两 个 或 更 多 个 交互 讲话 者 的 会 话 来 说 ， 从 用 户 讲话 或 移动 开始 到 该 动 
作 显 现在 其 他 端的 时 延 应 当 小 于 几 百 毫秒 。 对 于 语音 ， 小 于 150ms 的 时 延 不 会 被 人 类 听 者 
觉察 到 ，150 ~400ms 的 时 延 能 够 被 接受 ， 当 时 延 超 过 400ms 时 ， 即 使 不 会 使 对 话 变 得 完 
全 无 法 理解 ， 也 会 使 语音 会 话 变 得 令 人 泪 形 。 

另 一 个 方面 ， 会 话 式 多 媒体 应 用 容忍 丢 包 (loss-tolerant) ， 即 偶尔 的 丢失 只 会 在 音频 / 视 
频 回 放 时 偶尔 出 现 干扰 信号 ， 而 且 这 些 丢 失 经 常 可 以 部 分 或 者 全 部 地 隐藏 。 这 些 时 延 敏感 但 
容忍 丢 包 的 特性 明显 不 同 于 那些 弹性 数据 应 用 CA Web 浏览、 电子 邮件 、 社 交 网 络 和 远程 
注册 等 ) 的 特性 。 对 于 这 些 弹性 应 用 ， 长 时 延 令 人 烦恼 ， 但 并 不 是 特别 有 害 ， 然 而 传输 数据 
的 完全 和 完整 性 是 首要 的 。 我 们 将 在 9. 3 节 中 更 加 深入 地 探讨 会 话 式 语音 和 视频 ， 特 别 关注 
适应 性 播放 、 前 向 纠 错 和 差错 掩盖 是 如 何 减缓 网 络 引 入 的 分 组 丢失 和 时 延 的 。 

3. 流 式 实况 音频 和 视频 

这 种 第 三 类 应 用 类 似 于 传统 的 电台 广播 和 电视 ， 只 是 它 通 过 因特网 来 传输 而 已 。 这 些 
应 用 人 允许 用 户 接收 从 世界 上 任何 角落 发 出 的 实况 无 线 电 广播 和 电视 传输 。 今 天 有 数 以 千 
计 、 遍 及 全 球 的 无 线 电台 和 电视 台 正 在 因特网 上 广播 内 容 。 

实况 是 类 似 于 广播 的 应 用 ， 它 们 经 常 有 很 多 接收 相同 音频 /视频 节目 的 客户 。 在 今天 
的 因特网 中 ， 这 种 应 用 通常 是 用 CDN 来 实现 的 (2.6 节 ) 。 由 于 使 用 流 式 存储 多 媒体 ， 网 
络 必须 为 每 个 实况 多 媒体 流 提供 大 于 该 视频 消耗 速率 的 平均 吞吐 量 。 因 为 事件 是 直播 的 ， 
尽管 定时 限制 没有 会 话 式 语音 那么 严格 ， 但 时 延 也 可 能 成 为 问题 。 从 用 户 选 择 观 看 一 个 实 
况 传输 到 播放 开始 ， 能 够 容忍 的 时 延 最 多 为 10 秒 。 我 们 在 本 书 中 将 不 涉及 流 式 实况 媒体 ， 
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因为 用 于 流 式 实况 媒体 的 许多 技术 ( 如 初始 缓存 时 延 、 适 应 性 带宽 使 用 和 CDN 分 发 ) 都 
类 似 于 流 式 存 储 媒体 所 使 用 的 技术 。 


9.2 流 式 存 储 视 频 


对 于 流 式 视频 应 用 ， 预 先 录制 的 视频 放置 在 服务 器 上 ， 用 户 向 这 些 服务 器 发 送 请 求 按 
需 观看 这 些 视频 。 用 户 可 能 从 开始 到 结束 都 在 观看 视频 而 没有 中 断 它 ， 也 可 能 在 视频 结束 
前 停止 观看 它 ， 或 者 通过 暂停 、 重 新 定位 到 后 面 或 前 面 镜 头 来 与 视频 交互 。 流 式 视频 系统 
可 分 为 三 种 类 型 : UDP 流 (UDP streaming), HTTP 流 (HTTP streaming) 和 适应 性 HTTP 
ìt (adaptive HTTP streaming) (参见 2.6 节 )。 尽 管 在 实践 中 所 有 这 三 种 系统 都 在 使 用 ， 
但 绝 大 多 数 今天 的 系统 应 用 了 HTTP 流 和 适应 性 HTTP 流 。 

所 有 这 三 种 形式 的 视频 流 的 共同 特点 是 广泛 使 用 了 客户 端 应 用 缓存 ， 以 此 来 缓解 变化 
的 端 到 端 时 延 和 变化 的 服务 器 和 客户 之 间 可 用 带宽 量 的 影响 。 对 于 流 式 视 频 (存储 的 和 实 
况 的 ) ， 用 户 通常 能 够 容忍 在 客户 请 求 某 视频 与 该 流 视频 在 客户 端 播放 之 间 有 几 秒 的 初始 
小 时 延 。 所 以 ， 当 视频 开始 到 达 客 户 时 ， 客 户 不 必 立 即 开 始 播放 ， 反 而 能 够 在 应 用 程序 组 
存 中 建立 该 视频 的 储备 。 一 旦 该 客户 建立 起 几 秒 “已 缓存 但 尚未 播放 ”的 视频 储备 ， 客 户 
就 可 以 开始 视频 播放 了 。 这 种 客户 缓存 (client buffering) 具有 两 种 重要 的 优点 。 第 一 ， 客 
户 端 缓存 能 够 吸收 服务 器 到 客户 时 延 中 的 波动 。 如 果 某 特殊 部 分 的 视频 数据 延迟 了 ， 只 要 
它 在 “接收 到 但 尚未 播放 ”的 视频 耗 尽 之 前 到 达 ， 这 个 长 时 延 将 不 会 被 注意 到 。 第 二 ， 如 
果 服 务 器 到 客户 带宽 暂时 低 于 视频 消耗 速率 ， 用 户 能 够 继续 享受 连续 的 播放 ， 只 要 客户 应 
用 缓存 仍 没有 完全 排 尽 。 

图 9-1 显示 了 客户 端的 缓存 。 在 这 个 例子 中 ， 假 定 视频 以 固定 的 比特 率 编码 ， 因 此 每 
个 视频 块 包 含 了 能 在 相同 固定 时 间 量 A 区 间 播 放 的 视频 帧 。 服 务 器 在 to 传输 第 一 个 视频 
块 ， 在 i。+ A 传输 第 二 个 视频 块 ， 在 i。+2A 传输 第 三 个 视频 块 等 等 。 一 旦 客户 开始 播放 ， 
-为 了 重新 产生 初始 录制 视频 的 定时 ， 每 个 块 应 当 在 前 一 个 块 之 后 播放 A 时 间 单 元 。 第 一 个 
视频 块 于 i, 时 刻 到 达 ， 第 二 个 视频 块 于 i, 时 刻 到 达 。 第 i 块 的 网 络 时 延 是 服务 器 传输 该 块 
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图 9-1 视频 流 中 的 客户 播放 时 延 


的 时 间 与 客户 收 到 该 块 的 时 间 之 间 的 水 平 距 离 ; 注意 到 网 络 时 延 随 视频 块 不 同 而 变化 。 在 
此 例子 中 ， 如 果 客 户 准备 当 第 一 块 在 4 时 刻 一 到 达 就 开始 播放 ， 那 么 第 二 块 将 不 能 在 
t + A 时 刻 及 时 到 达 进 行 播放 。 在 这 种 情况 下 ， 视 频 播放 或 将 停止 运行 (等待 第 二 块 的 到 


444 BOF 


达 ) BAT REDS R, BARE RE ARE SB a BS A a, NR PORE 
放 延 迟到 t 时 刻 开始 ， 这 时 第 一 块 到 第 六 块 都 已 经 到 达 ， 所 有 已 经 收 到 的 块 在 它们 的 播放 
时 间 前 都 能 够 进行 周期 性 的 播放 。 


9.2.1 UDP ift 


我 们 这 里 仅 简 要 讨论 UDP 流 ， 在 适当 时 问 读者 更 为 深入 地 介绍 这 些 系 统 背 后 隐 含 的 
协议 。 使 用 UDP 流 ， 服 务 器 通过 UDP 以 一 种 稳定 的 速率 记录 下 视频 块 ， 用 与 客户 的 视频 
消耗 速率 相 匹 配 的 速率 传输 视频 。 例 如 ， 如 果 视 频 消 耗 率 是 2Mbps， 每 个 UDP 分 组 承载 
8000 比特 视频 ， 则 服务 器 将 每 阳 (8000 比特 ) / (2Mbps) =4ms 回 其 套 接 字 发 送 一 个 
UDP 分 组 。 如 我 们 在 第 3 章 所 知 ， 因 为 UDP 未 采用 某 种 拥塞 控制 机 制 ， 所 以 服务 器 能 够 
以 视频 的 消耗 速率 将 分 组 推进 网 络 中 ， 而 无 TCP 的 速率 控制 的 限制 。UDP 流通 常 使 用 很 
小 的 客户 端 缓 存 ， 空 间 维持 小 于 1 秒 视频 就 足够 了 。 

在 将 视频 块 传递 给 UDP 之 前 ， 服 务 器 将 视频 块 封 装 在 运输 分 组 中 ， 该 运输 分 组 是 专 
门 为 传输 音频 和 视频 而 设计 的 ， 使 用 了 实时 传输 协议 (Real-Time Transport Protocol, RTP) 
[RFC 3550] 或 某 种 类 似 (可 能 是 专用 ) 的 方案 。 我 们 将 在 9. 3 节 再 讨论 RTP， 那 时 我 们 
将 在 会 话 式 语音 和 视频 系统 环境 中 讨论 RTP。 

UDP 流 的 另 一 种 不 同 的 性 质 是 ， 除 了 服务 器 到 客户 的 视频 流 外 ， 两 者 间 还 并 行 地 维护 
一 个 单独 的 控制 连接 ， 通 过 该 连接 ， 客 户 可 发 送 有 关 会 话 状态 变化 的 命令 (如 暂停、 重新 
开始 、 重 定位 等 ) 。 这 种 控制 连接 在 许多 方面 类 似 于 我 们 在 第 2 章 中 学 习 的 FTP 控制 连接 。 
在 本 书 配 套 Web 网 站 上 更 为 详细 地 解释 了 实时 流 协 议 (Real-Time Streaming Protocol, 
RTSP) [RFC 2326 ] ， 它 是 一 种 用 于 这 样 的 控制 连接 的 流行 开放 协议 。 

尽管 UDP 流 已 经 在 多 个 开源 系统 和 专用 产品 中 得 到 应 用 ， 但 它 有 三 个 重大 不 足 。 首 
先 ， 由 于 服务 器 和 控制 之 间 的 可 用 带宽 无 法 预测 并 且 是 变化 的 ， 恒 定 速率 UDP 流 不 能 够 
提供 连续 的 播放 。 例 如 考虑 以 下 场景 : 视频 消耗 速率 为 1Mbps， 服 务 器 到 客户 可 用 市 宽 通 
常 超过 Mbps, 但 每 过 几 分 钟 就 有 几 秒 时 间 其 可 用 带宽 低 于 1Mbps。 在 这 种 场景 下 ， 以 
1 Mbps 恒定 速率 经 RTP/UDP 传输 视频 的 UDP 流 系统 很 可 能 将 提供 不 好 的 用 户 体 验 ， 在 可 
用 带宽 低 于 1Mbps 之 后 产生 停滞 或 漏 帧 。UDP 流 的 第 二 个 缺点 是 它 要 求 如 RTSP ARF ae 
样 的 媒体 控制 服务 器 ， 以 对 每 个 进行 中 的 客户 会 话 处 理 客户 到 服务 器 的 交互 请 求 和 跟踪 客 
户 状态 〈 例 如 在 视频 中 的 客户 播放 点 ， 视 频 是 否 被 暂停 或 播放 等 ) 。 这 增加 了 部 署 大 规模 
的 按 需 视频 系统 的 总 体 成 本 和 复杂 性 。 第 三 个 缺点 是 许多 防火 墙 配 置 为 阻塞 UDP 流量 ， 
防止 这 些 防火 墙 后 面 的 用 户 接 收 UDP 视频 。 


9.2.2 HTTP 流 


在 HTTP 流 中 ， 视 频 直接 作为 具有 一 个 特定 URL 的 普通 文件 存储 在 HTTP 服务 器 上 。 
当 用 户 要 看 视频 时 ， 客 户 和 服务 器 之 间 建 立 一 个 TCP 连接 ， 并 且 发 送 一 个 对 该 URL 的 
HTTP GET 请 求 。 服 务 器 则 尽 可 能 快 地 在 HT TP 响应 报 文中 发 送 该 视频 文件 ， 这 就 是 说 ， 
以 TCP 拥塞 控制 和 流 控制 允许 的 尽 可 能 快 的 速率 进行 处 理 。 在 客户 端 上 ， 字 节 收 集 在 一 个 
客户 应 用 缓存 中 。 一 旦 在 缓存 中 字 节 数量 超过 了 预先 设 定 的 阔 值 ， 该 客户 应 用 程序 开始 播 
放 ， 具 体 而 言 ， 它 周期 性 地 从 客户 应 用 缓存 中 抓 取 视频 帧 ， 对 帧 解压 缩 并 在 用 户 屏幕 上 显 
示 它 们 。 

我 们 在 第 3 章 学 习 过 ， 当 通过 TCP 传输 一 个 文件 时 ， 由 于 TCP 的 拥塞 控制 机 制 ， 服 
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务 器 到 客户 的 传输 速率 可 能 变化 很 大 。 特 别 是 ， 传 输 速率 以 与 TCP 拥塞 控制 相关 联 的 
“锯齿 ”形变 化 并 非 罕 见 。 此 外 ， 分 组 也 能 由 于 重 传 机 制 而 被 大 大 延 久 。 因 为 TCP 的 这 
些 特 点 ， 在 20 世纪 90 年 代 大 多 数 人 关于 会 话 式 的 看 法 是 流 式 视频 将 不 可 能 在 TCP 上 很 
好 地 工作 。 然 而 ， 随 着 时 间 的 推移 ， 流 式 视 频 系 统 的 设计 者 知道 了 当 使 用 了 客户 缓存 和 
预 取 (在 下 面 讨 论 ) 技术 时 ，TCP 的 拥塞 控制 和 可 靠 数据 传输 机 制 并 不 一 定 会 妨碍 连续 
播放 。 

在 TCP 上 使 用 HTTP 也 使 得 视频 穿越 防火 墙 和 NAT (它们 常常 被 配置 为 阻挡 UDP 流 
量 但 允许 大 部 分 HTTP 流量 通过 ) 更 为 容易 。HTTP 流 消除 了 因 需 要 媒体 控制 服务 器 (如 
RTSP 服务 器 ) 带 来 的 不 便 , 减少 了 在 因特网 上 大 规模 部 署 的 成 本 。 由 于 所 有 这 些 优点 ， 
今天 的 大 多 数 流 式 视 频 应 用 (包括 YouTube Fil Netflix) 都 使 用 HTTP 流 (在 TCP 上 ) 作为 
它 的 底层 流 式 协议 。 

1. 预 取 视频 

如 同 我 们 刚才 所 学 的 那样 ， 客 户 端 缓存 可 用 于 缓解 变化 的 端 到 端 时 延 和 变化 的 可 用 带 
宽 的 影响 。 在 前 面 图 9-1 的 例子 中 ， 服 务 器 以 视频 播放 的 速率 传输 。 然 而 ， 对 于 流 式 存储 
视频 ， 客 户 能 够 尝试 以 高 于 消耗 速率 的 速率 下 载 视 频 ， 因 此 预 取 (prefetching) 将 来 会 被 
消耗 的 视频 帧 。 该 预 取 的 视频 当然 存储 在 客户 应 用 缓存 中 。 这 样 的 预 取 自 然 伴随 TCP 流出 
现 ， 因 为 TCP 拥塞 避免 机 制 将 试图 使 用 服务 器 和 客户 之 间 的 所 有 可 用 带宽 。 

为 了 深入 洞察 预 取 技 术 ， 我们 来 举 个 简单 的 例子 。 假 设 视 频 消耗 速率 是 1Mbps， 而 网 
络 从 服务 器 到 客户 能 够 以 恒定 的 1. 5Mbps 速率 交付 视频 。 客 户 则 不 仅 能 够 以 非常 小 的 播放 
时 延 播 放 该 视频 ， 而 且 还 能 够 以 每 秒 500Kb 的 量 增加 缓存 的 视频 数据 。 以 这 种 方式 ， 如 果 
后 来 该 客户 在 一 段 短 暂时 间 内 以 小 于 1Mbps 的 速率 接收 数据 ， 该 客户 由 于 在 其 缓存 中 的 储 
备 将 能 够 继续 提供 连续 的 播放 。[ Wang 2008] 显示 了 当 平 均 TCP 吞吐 量 大 致 为 媒体 比特 
率 的 两 倍 时 ，TCP 流 导致 最 小 的 饥饿 和 低 缓 存 时 延 。 

2. 客户 应 用 缓存 和 TCP 缓存 


图 9-2 说 明了 客户 和 服务 右 之 间 HTTP 流 的 交互 。 在 服务 器 侧 ,视频 文件 中 的 日 色 部 
分 已 经 通过 服务 器 的 套 接 字 进 行 发 送 ， 而 黑色 部 分 是 留 下 待 发 送 的 部 分 。 在 “通过 套 接 字 
的 门 传送 ”之 后 ， 放 置 在 TCP 发 送 缓存 中 的 字 节 在 被 传输 进 因 特 网 之 前 如 第 3 章 所 描述 。 
在 图 9-2 中 ， 因 为 TCP 发 送 缓存 显示 为 满 ， 服 务 器 立即 防止 从 视频 文件 向 套 接 字 发 送 更 多 
的 字 节 。 在 客户 侧 ， 客 户 应 用 程序 (媒体 播放 器 ) 从 TCP 接收 缓存 (通过 其 客户 套 接 字 ) 
读 出 字 节 并 将 字 节 放 入 客户 应 用 缓存 中 。 与 此 同时 ， 客 户 应 用 程序 周期 性 地 从 客户 应 用 组 
存 中 抓 取 视 频 帧 ， 解 压缩 并 显示 在 用 户 屏 莫 上。 注意 到 如 果 客 户 应 用 缓存 大 于 该 视频 文 
件 ， 则 从 服务 器 存储 髓 到 客户 应 用 缓存 移动 字 节 的 整个 过 程 等 价 于 普通 文件 经 HTTP 的 下 
载 过程 ， 即 客户 直接 将 视频 用 TCP 允许 的 尽 可 能 快 的 速率 从 服务 器 中 拉 出 来 。 

现在 考虑 在 流 播放 期 间 当 用 户 暂 停 视频 时 将 发 生 的 现象 。 在 暂停 期 间 ， 比 特 未 从 客户 
应 用 缓存 中 删除 ， 甚 至 比特 继续 从 服务 器 进入 缓存 。 如 果 客 户 应 用 缓存 是 有 限 的 ， 它 可 能 
最 终 会 变 满 ， 这 将 反 过 来 引起 对 服务 器 的 “ 反 向 压力 ”"。 具 体 而 言 ， 一 旦 客户 应 用 缓存 变 
满 ， 字 节 不 再 从 客户 TCP 接收 缓存 中 删除 ， 因 此 它 也 会 变 满 。 一旦 客户 TCP 接收 缓存 变 
满 ， 字 节 不 再 从 服务 器 TCP 发 送 缓存 删除 ， 因 此 它 也 变 满 。 一旦 客户 TCP 发 送 缓存 变 满 ， 
服务 右 不 能 向 套 接 字 中 发 送 任何 更 多 的 字 节 。 因 此 ， 如 果 用 户 暂 停 视频 ， 服 务 右 可 能 被 迫 
停止 传输 ， 在 这 种 情况 下 服务 占 被 阻塞 ， 直 到 用 户 恢 复 该 视频 。 





周期 性 地 读 出 
帧 ， 解 压缩 并 
显示 在 屏幕 上 





图 9-2 经 HTTP/TCP 的 流 式 存 储 视频 


事实 上 ， 甚 至 在 常规 的 播放 过 程 中 〈 即 没有 暂停 ) ， 如 果 客 户 应 用 缓存 变 满 ， 反 向 压 
力 将 引起 TCP 缓存 变 满 ， 这 将 迫使 服务 需 降 低 其 速率 。 为 了 决定 其 产生 的 速率 ， 注 意 到 当 
客户 缓存 删除 了 比特， 它 在 客户 应 用 缓存 中 产生 了 j 比 特 的 空间 ， 这 依次 允许 服务 器 发 送 
额外 的 比特 。 因 此， 服务 器 发 送 速 率 不 能 比 客户 端 视频 消耗 速率 更 高 。 因 此 ， 当 使 用 
HTTP 流 时 ， 一 个 满 的 客户 应 用 缓存 间接 地 对 服务 器 到 客户 能 够 发 送 的 视频 速率 施加 了 
限制 。 

3. 流 式 视 频 的 分 析 


某 些 简 单 的 建 模 将 有 助 于 洞察 由 于 应 用 缓存 消耗 所 产生 的 初始 播放 时 延 和 停滞 。 如 
图 9-3 所 示 ，B 表示 客户 应 用 缓存 的 长 度 (以 比特 计 )，Q 表示 在 客户 应 用 缓存 开始 播放 之 
前 必须 被 缓存 的 比特 数量 。( 当然 ，Q@ <B。) r 表示 视频 消耗 速率 ， 即 客户 在 播放 期 间 从 客 
户 应 用 缓存 提取 比特 的 速率 。 在 此 情况 下 ， 举 例 来 说 ， 如 果 视 频 的 帧 速率 是 30 帧 / 秒 ， 每 
(压缩 ) 帧 是 100 000 比特 ， 则 r=3Mbps。 为 了 从 细节 看 整体 ， 我 们 将 忽略 TCP 的 发 送 和 
接收 缓存 。 





客户 应 用 缓存 


图 9-3 流 式 视频 的 客户 端 缓 存 的 分 析 


我 们 假设 无 论 何 时 客户 缓存 都 为 非 空 ， 服 务 器 以 一 种 恒定 速率 x 发 送 比 特 。( 这 是 一 
种 显而易见 的 简化 ， 因 为 TCP 的 发 送 速率 由 于 拥塞 控制 而 变化 ; 在 本 章 后 面 的 习题 中 我 们 
将 考察 更 为 真实 的 与 时 间 相 关 的 速率 x(t) 。) 假设 在 时 刻 上 =0， 应 用 缓存 为 空 ， 视 频 开 始 
到 达 客 户 应 用 缓存 。 我 们 现在 问 ， 在 什么 时 刻 上 = 已 开始 播放 呢 ? 并 且 在 播放 过 程 中 ， 什 
么 时 刻 上 = 客户 应 用 绥 存 变 满 呢 ? 
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首先 ， 我 们 来 确定 t,， 此 时 O 比特 已 经 进入 应 用 缓存 并 且 开 始 播 放 。 前 面 讲 过 比特 以 
速率 x 到 达 客 户 应 用 缓存 ， 并 且 在 开始 播放 之 前 没有 比特 从 其 缓存 中 删除 。 所 以 ,建立 0 
比特 所 需 的 时 间 (初始 缓存 时 延 ) Æ t, = Q/x。 

我 们 现在 来 决定 tt， 这 是 客户 应 用 缓存 变 满 的 时 刻 。 我 们 先 观 察 ， 如 果 x <r( 即 如 果 
服务 器 发 送 速率 小 于 视频 消耗 速率 ) ， 则 客户 缓存 将 决 不 会 满 ! NM, Ale, 开始 ， 缓 存 
将 以 速率 r 排 空 并 且 仅 以 速率 x <r 填充 。 最 终 客户 缓存 将 完全 排 空 ， 此 时 当 客户 缓存 等 待 
男 一 个 i 秒 来 建 起 0 比特 的 视频 时 ， 视 频 将 在 屏幕 上 停滞。 所 以 ， 当 网 络 中 可 用 速率 小 
于 视频 速率 时 ， 播 放 将 在 连续 播放 期 和 停滞 播放 期 之 间 进 行 变动 。 在 课 后 习题 中 ， 将 请 你 
决定 每 个 连续 播放 期 和 停 浪 期 的 长 度 ， 它 们 都 作为 GC、r 和 zx 的 水 数 。 当 x>r 时 ,现在 我 
们 来 决定 i。 在 这 种 情况 下 ， 在 时 刻 i, 开始 ， 缓 存 以 x -r 的 速率 从 0 增加 到 B， 因 为 比特 
以 速率 7 消耗 但 以 速率 x 到达， 如 图 9-3 所 示 。 有 了 这 些 提 示 ， 在 课 后 习题 中 将 请 你 决定 
ti， 即 客户 缓存 变 满 的 时 刻 。 注 意 到 当 网 络 中 的 可 用 速率 大 于 视频 速率 时 ， 在 初始 缓存 时 
延 后 ， 用 户 将 享受 连续 的 播放 直到 视频 结束 。 

4. 视频 的 早期 中 止 和 重 定位 

HTTP 流 系统 经 常 利用 HTTP GET 请 求 报 文中 的 HTTP 字 节 范围 首部 (HTTP byte- 
range header) ， 该 首部 指示 了 客户 当前 要 从 所 希望 的 视频 中 获取 的 字 节 范围 。 当 用 户 要 在 
视频 中 及 时 重 定位 〈 即 跳跃 ) 到 未 来 点 时 ， 这 特别 有 用 。 当 用 户 重 定位 到 一 个 新 位 置 时 ， 
客户 发 送 一 个 新 HTTP 请 求 ， 用 字 节 范围 首部 指出 服务 器 应 当 从 文件 的 哪个 字 节 起 发 送 数 
据 。 当 服务 器 接收 到 该 新 的 HTTP 请 求 时 ， 它 能 够 忘记 任何 较 早 的 请 求 ， 而 是 由 字 节 范围 
请 求 中 指示 的 字 节 开始 发 送 。 

在 我 们 讨论 重 定位 主题 的 时 候 ， 我 们 简要 地 提 及 当 某 用 户 重 定位 到 视频 中 的 某 个 未 来 
点 或 提前 终止 视频 时 ， 某 些 由 服务 器 发 送 的 已 预 取 但 尚未 观看 的 数据 将 不 会 被 观看 ， 即 导 
致 了 网 络 带宽 和 服务 器 资源 的 浪费 。 例 如 ， 假 设 在 视频 中 的 某 时 刻 i。 客户 缓存 充满 B 比 
特 ， 在 此 时 用 户 重 定 位 到 视频 中 的 某 个 瞬间 ¢ >t) + Br， 然 后 从 这 点 起 观察 视频 直到 结束 。 
在 这 种 情况 下 ， 缓存 中 的 所 有 B 比特 将 未 被 观看 ， 用 于 传输 这 B 比特 的 带宽 和 服务 器 资源 
完全 被 浪费 掉 了 。 在 因特网 中 ， 有 大 量 的 带宽 因 提 前 终止 而 浪费 ， 这 些 成 本 可 能 相当 大 ， 
特别 是 对 于 无 线 链 路 [Ihm 2011 ] 。 由 于 这 个 原因 ， 许 多 流 系统 仅 使 用 了 长 度 适 当 的 客户 
应 用 缓存 ， 或 者 将 限制 在 HTTP 请 求 中 使 用 字 节 范围 首部 预 取 的 视频 数量 [| Rao 2011], 

重 定位 和 提前 终止 可 以 与 下 列 做 法 类 比 : 毫 调 了 很 多 肉 ， 仅 吃 了 一 部 分 ， 并 将 其 他 都 
扔 掉 ， 因 而 浪费 了 食物 。 因 此 ， 下 次 你 因为 没有 吃 完 所 有 晚餐 而 被 父母 批评 浪费 食物 时 ， 
你 能 够 迅速 反驳 : 当 他 们 在 因特网 上 观看 电影 并 进行 带宽 重 定位 时 ， 他 们 浪费 了 带宽 和 服 
务 需 资源 ! 但 是 ， 别 人 错 了 不 等 于 你 对 了 ， 食 物 和 带宽 都 不 应 被 浪费 ! 

在 9.2.1 节 和 9.2.2 节 中 ， 我 们 分 别 学 习 了 UDP iM HTTP 流 。 第 三 种 流 是 经 HTTP 
的 动态 适应 流 (DASH), DASH 使 用 了 该 视频 的 多 个 版 本 ， 每 个 版 本 是 以 不 同 速率 压缩 而 
成 的 。DASH 在 2. 6. 2 节 中 进行 了 详细 讨论 。 分 发 存储 和 实况 视频 经 常 使 用 CDN, CDN 在 
2.6.3 节 中 进行 了 详细 讨论 。 


9.3 IP 语 音 


经 因特网 的 实时 会 话 式 语音 经 常 被 称 为 因特网 电话 (Internet telephony ) ， 因 为 从 用 户 
的 视角 看 ， 它 类 似 于 传统 的 电路 交换 电话 服务 。 它 通常 也 被 称 为 IP 语音 (Voice-over- 卫 ， 
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VoIP) 。 在 本 节 中 我 们 描述 VoIP 所 依据 的 原则 和 协议 。 会 话 式 视频 在 许多 方面 类 似 于 
VoIP， 除 了 它 包括 参与 者 的 视频 以 及 他 们 的 语音 以 外 。 为 了 使 讨论 重点 突出 且 具 体 ， 我 们 
这 里 仅 关 注 语音 ， 而 不 是 语音 和 视频 的 结合 。 


9.3.1 尽力 而 为 服务 的 限制 


因特网 的 网 络 层 协议 IP 提供 了 尽力 而 为 的 服务 。 那 就 是 说 服务 尽 全 力 将 每 个 数据 报 
从 源 尽 可 能 快 地 移动 到 目的 地 ,但 是 没有 就 在 某 些 时 延 界限 内 使 分 组 到 达 目 的 地 或 丢 包 百 
分 比 的 限制 做 任何 承诺 。 缺 失 这 种 保证 对 实时 会 话 式 应 用 的 设计 提出 了 严峻 挑战 ， 这 些 应 
用 对 分 组 时 延 、 时 延 拌 动 和 丢 包 非常 敏感 。 

在 本 节 中 ， 我 们 将 讨论 加 强 尽 力 而 为 网 络 上 的 VoIP 性 能 的 几 种 方式 。 我 们 的 重点 将 
在 应 用 层 技 术 上 ， 即 这 些 技术 并 不 要 求 在 网 络 核心 甚至 在 端 系统 的 运输 层 有 任何 变化 。 为 
了 使 讨论 具体 ， 我 们 将 讨论 在 一 个 特定 的 VoIP 例子 环境 下 尽力 而 为 IP 服务 的 限制 。 发 送 
方 以 每 秒 8000 字 节 的 速率 产生 字 节 ， 且 每 20ms 将 字 节 汇聚 成 块 。 每 个 块 和 一 个 特殊 的 首 
部 (在 下 面 讨 论 ) 封装 在 一 个 UDP 报 文 段 中 (通过 一 个 到 套 接 字 接 口 的 呼叫 ) 。 因 此 ， 一 
个 块 中 的 字 节 数 为 (20ms) x (8000 字 节 / 秒 ) =160 字 节 ， 每 20ms 发 送 一 个 UDP 报 文 段 。 

如 果 每 个 分 组 以 恒定 的 端 到 端 时 延 到 达 接 收 方 ， 那 么 分 组 每 隔 20ms 就 能 周期 性 地 到 
达 接 收 方 。 在 这 种 理想 的 情况 下 ， 只 要 每 个 块 一 到 达 ， 接 收 方 就 能 直接 播放 它 。 但 不 幸 的 
是 ， 某 些 分 组 可 能 丢失 ， 大 多 数 分 组 没有 相同 的 端 到 端 时 延 ， 即 使 在 一 个 轻 度 拥塞 的 因 特 
网 中 也 是 如 此 。 因 此 ， 接 收 方 必 须 更 仔细 地 判断 : 中 什么 时 候 播 放 一 个 块 ; @ 如 何 处 理 一 
个 丢失 块 。 

1. Ey 


考虑 由 VoIP 应 用 产生 的 一 个 UDP 报 文 段 。 这 个 UDP 报 文 段 封装 在 IP 数据 报 中 。 当 
数据 报 在 网 络 中 徘徊 时 ， 在 它 等 待 出 链 路 传输 时 要 经 过 路 由 器 的 缓存 ( 即 队 列 ) 。 从 发 送 
方 到 接收 方 的 路 径 上 的 一 个 或 多 个 缓存 有 可 能 是 满 的 ， 不 能 接纳 该 IP 数据 报 。 在 这 种 情 
况 下 ， 这 个 IP 数据 报 就 被 丢弃 了 ， 永 远 不 会 到 达 接 收 方 的 应 用 程序 。 

通过 TCP ( 它 提 供 了 可 靠 数 据 传 输 ) 而 不 是 UDP 发 送 分 组 可 以 消除 丢失 。 然 而 ， 重 
传 机 制 对 于 诸如 VoIP 这 样 的 会 话 式 实 时 音频 应 用 ， 通 常 认为 是 不 可 接受 的 ， 因 为 它们 增 
加 了 端 到 端 时 延 [Bolot 1996 ] 。 此 外 ， 当 丢 包 后 ， 由 于 TCP 的 拥塞 控制 ， 发 送 方 的 传输 速 
率 可 能 减少 到 低 于 接收 方 的 排 空 速 率 ， 可 能 导致 缓存 “ 饥 狐 ”。 这 可 能 会 对 接收 方 的 语音 
可 理解 程度 产生 严重 影响 。 由 于 这 些 原 因 ， 几 乎 所 有 现 有 的 VoIP 应 用 默认 运行 在 UDP 
上 。[ Baset 2006] 报告 称 Skype 使 用 了 UDP， 除 非 用 户 位 于 阻碍 UDP 报 文 段 的 NAT 或 防 
火 墙 之 后 (这 时 使 用 TCP), 

但 是 分 组 的 丢失 并 不 一 定 会 造成 人 们 想象 中 的 灾难 。 实 际 上 ， 取 决 于 语音 是 如 何 编码 
和 传输 的 以 及 接收 方 隐藏 丢 包 的 方式 ，1% ~20% 的 丢 包 率 是 可 以 忍受 的 。 例 如 ， 前 向 纠 
错 (FEC) 能 够 有 助 于 隐藏 丢 包 。 我 们 后 面 可 以 看 到 ， 通 过 使 用 FEC， 将 元 余 信 息 和 初始 
信息 一 起 传输 ， 以 便 能 够 从 宛 余 信 息 中 恢复 一 些 丢 失 的 初始 数据 。 无 论 如 何 ， 如 果 发 送 方 
和 接收 方 之 间 的 一 段 或 多 段 链 路 严重 拥塞 ， 丢 包 率 超过 10% ~ 20% (例如 在 无 线 链 路 
上 ) ， 那 么 无 论 采 取 何 种 措施 都 无 法 获得 可 以 接受 的 声音 质量 了 。 显 然 ， 尽 力 而 为 服务 有 
它 的 局 限 性 。 

2.， 端 到 端 时 延 


端 到 端 时 延 (end-to-end delay) 是 以 下 因素 的 总 和 : 路 由 需 中 的 传输 、 处 理 和 排队 时 
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延 ， 链 路 中 的 传播 时 延 和 端 系统 的 处 理 时 延 。 对 于 实时 会 话 式 应 用 ， 例 如 VoIP， 听 电话 的 
人 对 于 小 于 150ms 的 端 到 端 时 延 是 觉察 不 到 的 ; 在 130ms 和 400ms 之 间 的 时 延 能 够 接受 ， 
但 是 不 够 理想 ; 超过 400ms 的 时 延 可 能 严重 妨碍 语音 谈话 的 交互 性 。VoIP 应 用 程序 的 接 
收 方 通常 忽略 时 延 超 过 特定 阅 值 (例如 超过 400ms) 的 任何 分 组 。 因 此 ， 时 延 超 过 该 阔 值 
的 分 组 等 效 于 丢弃 。 

3. 分 组 时 延 抖 动 

端 到 端 时 延 的 一 个 关键 成 分 是 一 个 分 组 在 网 络 路 由 器 中 经 历 的 变化 的 排队 时 延 。 由 于 
这 些 可 变 的 时 延 ， 从 在 源 中 产生 分 组 到 它 在 接收 方 收 到 的 这 段 时 间 ， 对 于 不 同 的 分 组 可 能 
会 有 波动 ， 如 图 9-1 所 示 。 这 个 现象 称 为 时 延 抖动 (jitter) 。 举 一 个 例子 ， 考 虑 在 VoIP 应 
用 中 两 个 连续 的 分 组 。 发 送 方 在 发 送 第 一 个 分 组 20ms 之 后 发 送 第 二 个 分 组 。 但 是 在 接收 
方 ， 这 两 个 分 组 之 间 的 间隔 可 能 变 得 大 于 20ms。 为 了 理解 这 一 点 ， 假 设 第 一 个 分 组 到 达 
路 由 器 的 一 个 几乎 为 空 的 队列 ， 但 是 恰好 在 第 二 个 分 组 到 达 该 队列 之 前 ， 从 其 他 源 来 的 大 
量 分 组 也 到 达 了 相同 的 队列 。 因 为 在 这 个 路 由 器 中 第 一 个 分 组 经 受 了 很 小 的 排队 时 延 ， 而 
第 二 个 分 组 经 受 了 较 大 的 排队 时 延 ， 这 两 个 连续 的 分 组 之 间 的 时 间 间 隔 变 得 大 于 20ms 了 。 
两 个 连续 分 组 的 间隔 也 可 能 会 小 于 20ms。 为 了 理解 这 种 情况 ， 再 次 考虑 两 个 连续 的 分 组 。 
假设 第 一 个 分 组 加 入 一 个 有 大 量 分 组 队列 的 队 尾 ， 并 且 第 二 个 分 组 到 达 这 个 队列 时 第 一 个 
分 组 尚未 被 传输 ， 而 且 来 自 其 他 源 的 分 组 尚未 到 达 该 队列 。 在 这 种 情况 下 ， 这 两 个 分 组 发 
现 它们 在 队列 中 互相 紧 挨 着 。 如 果 在 路 由 器 的 出 链 路 传输 一 个 分 组 所 需 时 间 小 于 20ms， 
则 第 一 个 分 组 和 第 二 个 分 组 的 间隔 就 变 得 小 于 20ms 了 。 

这 种 情况 可 以 与 在 公路 上 开车 相 类 比 。 假 设 你 和 你 的 朋友 每 人 驾驶 一 辆 车 从 美国 的 圣 
地 亚 哥 到 凤凰 城 。 并 且 假 设 你 和 朋友 有 类 似 的 驾驶 风格 ， 而 且 你 们 都 以 交通 规则 允许 的 
100km/h 的 速度 驾驶 。 如 果 你 的 朋友 在 你 之 前 一 个 小 时 出 发 ， 那 么 根据 干扰 车 流量 的 不 
同 ， 你 可 能 在 你 的 朋友 之 后 一 个 小 时 左右 到 达 凤 凰 城 。 

如 果 接 收 方 忽略 了 时 延 拌 动 的 存在 ， 一旦 该 块 到 达 就 开始 播放 ， 那 么 在 接收 方 产生 的 
音频 质量 很 容易 变 得 不 可 理解 。 幸 运 的 是 ， 时 延 抖 动 通常 可 以 通过 使 用 序号 (sequence 
number) 、 时 间 戳 (timestamp) 和 播放 时 延 (playout delay) 来 消除 ， 如 下 面 所 讨论 的 
内 容 。 


9.3.2 在 接收 方 消除 音频 的 时 延 抖动 


对 于 VoIP 应 用 ， 周 期 性 地 产生 分 组 ， 接 收 方 应 该 在 存在 随机 网 络 时 延 抖 动 的 情况 下 
尝试 提供 播放 语音 块 。 这 经 常 通过 结合 下 面 两 种 机 制 来 实现 : 
© 为 每 个 块 预先 计划 一 个 时 间 惟 〈timestamp ) 。 发 送 方 用 每 个 块 产 生 的 时 刻 为 它 加 上 
时 间 印 记 。 
© 在 接收 方 延迟 播放 (delaying playout) 块 。 如 我 们 前 面 在 图 9-1 的 讨论 所 见 ， 接 收 
的 音频 块 的 播放 时 延 必 须 足够 长 ， 以 便 大 多 数 分 组 在 它们 的 预定 播放 时 间 之 前 被 
接收 到 。 这 个 播放 时 延 可 能 在 整个 音频 会 话 期 间 是 固定 的 ， 或 者 在 音频 会 话 生 命 
期 中 适应 性 地 变化 。 
我 们 现在 讨论 如 何 结合 这 三 种 机 制 来 减轻 甚至 消除 时 延 拌 动 的 影响 。 我 们 研究 两 种 播 
放 策 略 : 固定 播放 时 延 和 适应 性 播放 时 延 。 
1. 固定 播放 时 延 
使 用 固定 播放 时 延 策略 ， 接 收 方 试 图 在 块 产 生 正好 9 ms 后 播放 它 。 因 此 如 果 一 个 块 
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在 时 刻 上 打上 时 间 戳 ， 接 收 方 在 时 刻 上 +9 播放 这 个 块 ， 假 设 这 个 块 在 那个 时 间 已 经 到 达 。 
在 预定 播放 时 间 之 后 到 达 的 分 组 将 被 丢弃 ， 并 被 认为 已 经 丢失 。 

4 选择 什么 值 为 好 呢 ? 尽管 使 用 更 小 的 9 值 可 以 获得 更 令 人 满意 的 会 话 体验 ,但 VoIP 
能 够 支持 高 达 约 400ms 的 时 延 。 另 一 方面 ， 如 果 g 比 400ms 小 得 多 ， 那 么 由 于 网 络 引 入 的 
分 组 时 延 抖 动 会 使 许多 分 组 可 能 错过 了 它们 的 预定 播放 时 间 。 概 括 地 说 ， 如 果 端 到 端 时 延 
经 常 发 生 大 的 变化 ， 用 一 个 大 的 4 更 好 ; 另 一 方面 ， 如 果 时 延 很 小 并 且 时 延 变 化 也 很 小 ， 
用 一 个 较 小 的 、 可 能 小 于 150ms 的 g 更 好 。 

在 图 9-4 中 说 明了 播放 时 延 和 丢 
包 之 间 的 折 中 。 该 图 表示 了 单个 话音 
突 峰 期 的 分 组 产生 和 播放 的 时 间 。 考 
虑 了 两 种 不 同 的 初始 播放 时 延 。 如 最 
左边 的 阶梯 所 示 ， 发 送 方 以 规则 的 间 
隔 (比方 说 每 20ms) 产生 一 组 分 组 。 
在 这 个 话音 突 峰 期 中 的 第 一 个 分 组 在 
时 刻 r 被 接收 到 。 如 该 图 所 示 ， 由 于 
网 络 时 延 拌 动 ， 后 续 分 组 的 到 达 间 隔 
是 不 均匀 的 。 

对 于 第 一 个 播放 调度 时 间 ， 固 定 
的 初始 播放 时 延 设置 为 p -r+r。 使 用 这 
个 方案 ， 第 四 个 分 组 没有 在 它 调 度 的 播放 时 间 到 达 ， 接 收 方 认为 它 丢 失 了 。 对 于 第 二 个 调 
度 时 间 ， 固 定 的 初始 播放 时 延 设置 为 p' - r。 对 于 这 个 方案 ， 所 有 分 组 都 在 它们 调度 的 播 
放 时 间 之 前 到 达 ， 因 此 没有 丢失 。 

2. 适应 性 播放 时 延 

上 面 的 例子 显示 了 当 使 用 固定 播放 时 延 来 设计 播放 策略 时 所 引起 的 重要 的 时 延 与 丢 包 
折 中 。 若 初始 播放 时 延 设 置 得 比较 大 ， 大 多 数 分 组 能 在 它们 的 截止 时 间 内 到 达 ， 因 此 存在 
的 丢失 将 可 忽略 不 计 ; 然而 ， 对 于 如 VoIP 这 样 的 会 话 式 服务 ， 长 时 延 即使 不 是 不 能 忍受 
的 ， 至 少 也 是 令 人 厌恶 的 。 在 理想 情况 下 ， 我 们 希望 播放 时 延 最 小 化 ， 使 丢 包 低 于 一 定 百 
分 比 的 限制 。 

处 理 这 种 折 中 的 自然 方法 是 估计 网 络 时 延 和 网 络 时 延 变化 ， 并 且 在 每 个 话音 突 峰 期 的 
开始 相应 地 调整 播放 时 延 。 在 话音 突 峰 期 开始 时 适应 性 地 调整 播放 时 延 将 导致 发 送 方 静默 
期 的 压缩 和 拉 长 ; 然而 ， 静 默 期 的 少量 压缩 和 拉 长 在 谈话 中 是 不 易 觉察 的 。 

根据 [Ramjee 1994 ] ， 我 们 现在 描述 一 种 接收 方 可 以 用 于 适应 性 地 调整 它 的 播放 时 延 
的 通用 算法 。 为 此 ， 令 

tf; = 第 ;个 分 组 的 时 间 改 = 该 分 组 在 发 送 方 产 生 的 时 间 
ri = 分 组 i 被 接收 方 接收 的 时 间 
pi = 分 组 i 在 接收 方 播放 的 时 间 

第 i 个 分 组 的 端 到 端 网 络 时 延 是 7, -t;。 由 于 网 络 时 延 拌 动 ， 这 个 时 延 在 不 同 的 分 组 之 
间 会 发 生变 化 。 令 di 表示 接收 到 第 i 个 分 组 时 的 平均 网 络 时 延 的 估计 值 。 这 个 估计 值 根据 
如 下 的 时 间 惟 来 构造 : 





图 9-4 不 同 的 固定 播放 时 延 情况 下 的 丢 包 


d; si -—u)d,, + u(r; -= t;) 
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式 中 是 一 个 固定 的 常数 (例如 ，w =0.01), XE d; 是 观察 到 的 网 络 时 延 r -t e 
r; 一 的 一 个 平滑 均值 。 这 个 估计 值 为 最 近 观 察 到 的 网 络 时 延 设置 了 比 过 去 一 段 时 间 观 察 到 
的 网 络 时 延 有 更 大 的 权重 。 这 种 估 值 的 形式 不 应 该 是 完全 陌生 的 ; 相似 的 思想 在 第 3 章 讨 
论 估计 TCP 往返 时 间 时 就 使 用 过 。 令 v 表示 与 估计 平均 时 延 的 平均 时 延 绝 对 偏差 的 估计 
值 。 这 个 估计 值 也 可 从 这 些 时 间 惟 构建 : 
% = (Ll = we, +ulr, -t, -—d, | 

为 每 个 接收 的 分 组 计算 估计 值 d; 和 w;， 尽 管 它们 仅 能 用 于 为 任何 话音 突 峰 期 的 第 一 个 

一 旦 计算 完了 这 些 估计 值 ， 接 收 方 为 分 组 播放 应 用 下 列 的 算法 。 如 果 分 组 i 是 一 个 话 
音 突 峰 期 的 第 一 个 分 组 ， 它 的 播放 时 间 p; 计算 如 下 : 

p =t, +d; + Kv, 
这 里 是 一 个 正 的 常数 (例如 kK=4)。kKv; 项 的 目的 是 给 将 来 设置 足够 大 的 播放 时 间 ， 
以 便 话音 突 峰 期 中 只 有 一 小 部 分 到 达 的 分 组 由 于 述 到 而 丢失 。 在 一 个 话音 突 峰 期 中 任何 
后 续 分 组 的 播放 点 被 计算 为 对 于 这 个 话音 突 峰 期 的 第 一 个 分 组 播放 时 间 点 的 偏 移 。 特 别 
二 
qi = 
表示 从 话音 突 峰 期 的 第 一 个 分 组 产生 到 它 播放 的 时 间 长 度 。 如 果 分 组 j 也 属于 这 个 话音 突 
峰 期 ， 它 播放 的 时 刻 是 
B ty weg; 

刚才 描述 的 算法 在 假设 接收 方 能 够 辨 明 一 个 分 组 是 否 是 话音 突 峰 期 中 的 第 一 个 分 组 的 

情况 下 很 有 意义 。 这 能 够 通过 检查 每 个 接收 到 的 分 组 中 的 信号 能 量 来 做 到 。 


9.3.3 从 丢 包 中 恢复 


我 们 已 经 较为 详细 地 讨论 了 一 个 VoIP 应 用 能 够 怎样 处 理 分 组 时 延 抖 动 。 我 们 现在 简 
要 地 描述 在 存在 丢 包 的 情况 下 几 种 试图 保护 可 接受 的 音频 质量 的 方案 。 这 样 的 方案 被 称 为 
丢 包 恢复 方案 (loss recovery scheme) 。 这 里 我 们 定义 了 广义 的 丢 包 : 如 果 某 分 组 不 能 到 达 
接收 方 或 者 在 它 调度 的 播放 时 间 之 后 才 到 达 ， 该 分 组 则 丢失 。 我 们 再 次 用 VoIP 例子 作为 
描述 丢 包 恢复 方案 的 环境 。 

如 在 本 节 开 始 提 到 的 那样 ， 在 诸如 VoIP 等 会 话 式 实时 应 用 中 ， 重 传 丢 失 的 分 组 通常 
是 不 可 行 的 。 的 确 ， 重 传 一 个 已 经 错过 了 播放 截止 时 间 的 分 组 是 绝对 没有 意义 的 。 而 且 重 
传 一 个 在 路 由 右 队 列 溢出 的 分 组 通常 不 能 足够 快 地 完成 。 由 于 这 些 考虑 ，VolP 应 用 通常 
使 用 某 种 类 型 的 丢 包 预期 方案 。 两 种 类 型 的 丢 包 预期 方案 是 前 向 纠 错 (Forward Error Cor- 
rection, FEC) 与 交织 (interleaving) ) 。 


1. 前 向 纠 错 


FEC 的 基本 思想 是 给 初始 的 分 组 流 增加 元 余 信息 。 以 稍微 增加 传输 速率 为 代价 ， 这 些 
元 余 信 息 可 以 用 来 重建 一 些 丢 失 分 组 的 近似 或 者 准确 版 本 。 根 据 文献 [Bolot 1996] 和 
[Perkins 1998 | ， 我 们 现在 概括 了 两 种 简单 的 FEC 机 制 。 第 一 种 机 制 是 每 发 送 n 个 块 之 后 
发 送 一 个 元 余 编 码 的 块 。 这 个 元 余 块 通过 异 或 n 个 初始 块 来 获得 [Shacham 1990 ] 。 以 这 
种 方式 ， 在 这 n+1 个 分 组 的 组 中 ， 如 果 任 何 一 个 分 组 丢失 ， 接 收 方 能 够 完全 重建 丢失 的 
分 组 。 但 是 如 果 这 一 组 中 有 两 个 或 更 多 分 组 丢失 ， 接 收 方 则 无 法 重建 丢失 的 分 组 。 通 过 让 
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组 的 长 度 n+1 比较 小 ， 当 丢失 不 是 很 多 时 ， 大 部 分 丢失 分 组 都 可 以 恢复 。 然 而 组 的 长 度 
越 小 ， 相 对 增加 的 传输 速率 就 越 大 。 特 别 是 若 传输 速率 以 1/n 因子 增加 的 话 ， 例 如 n=3， 
则 传输 速率 增加 33% 。 此 外 ， 这 个 简单 的 方案 增加 了 播放 时 延 ， 因 为 接收 方 在 能 够 开始 播 
放 之 前 ， 必 须 等 待 收 到 整个 组 的 分 组 。 有 关 FEC 在 多 媒体 传输 上 如 何 工作 的 更 多 实践 细节 
参见 [RFC 5109], 

第 二 个 FEC 机 制 是 发 送 一 个 较 低 分 辩 率 的 音频 流 作 为 元 余 信 息 。 例 如 ， 发 送 方 可 能 创 
建 一 个 标 称 的 音频 流 和 一 个 相应 的 低 分 辨 率 、 低 比特 率 的 音频 流 。 (这 个 标 称 流 可 能 是 一 
个 64kbps 的 PCM 编码 ， 而 这 个 较 低 质量 的 流 可 能 是 一 个 13kbps 的 GSM 编码 。) 这 个 低 比 
特 率 流 被 认为 是 元 余 信息 。 如 图 9-5 所 示 ， 发 送 方 通过 从 这 个 标 称 流 中 取出 第 个 块 并 附 
加 上 第 (n -1) 个 块 的 元 余 信 息 ， 以 构建 第 n 个 分 组 。 以 这 种 方式 ， 只 要 没有 连续 分 组 的 
丢失 ， 接 收 方 都 可 以 通过 播放 和 后 续 分 组 一 起 到 达 的 低 比 特 率 编码 块 来 隐藏 丢失 。 当 然 ， 
低 比 特 率 块 比 标 称 块 的 质量 要 低 。 然 而 ， 在 一 个 流 主要 是 由 高 质量 块 组 成 、 偶 尔 出 现 低 质 
量 块 并 且 没 有 丢失 的 块 的 情况 下 ， 其 整体 的 音频 质量 良好 。 注 意 到 在 这 种 方案 中 ， 接 收 方 
在 播放 前 只 需 接收 两 个 分 组 ， 因 此 增加 的 时 延 小 。 此 外 ， 如 果 低 比特 率 编码 比 标 称 编码 少 
得 多 ， 那 么 传输 速率 的 额外 增加 并 不 大 。 
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为 了 处 理 连续 丢失 ， 我 们 能 够 使 用 率 一 个 简单 的 修正 方案 。 发 送 方 不 再 仅 为 第 个 标 
称 块 附加 上 第 (n -1) 个 低 比 特 率 块 ， 而 是 附加 上 第 (nn -1) 个 和 第 (n -2) 个 低 比特 
BR, 或 者 附加 第 (n -1) 个 和 第 (n -3) 个 低 比 特 率 块 等 等 。 通 过 给 每 个 标 称 块 附加 
上 更 多 低 比 特 率 块 ， 在 各 种 恶劣 的 尽力 而 为 服务 环境 下 接收 方 的 音频 质量 变 得 可 接受 。 在 
为 一 方面 ， 附 加 的 块 增加 了 传输 带宽 和 播放 时 延 。 

2. 交织 

作为 元 余 传输 的 男 一 种 替代 方案 ，VolP 应 用 可 以 发 送 交 织 的 音频 。 如 图 9-6 Pa, 发 
送 方 在 传输 之 前 对 音频 数据 单元 重新 排序 ， 使 得 最 初 相 邻 的 单元 在 传输 流 中 以 一 定 距离 分 
离开 来 。 交 织 可 以 减轻 丢 包 的 影响 。 例 如 ， 如 果 每 个 单元 长 为 Sms， 块 是 20ms (也 就 是 每 
个 块 4 个 单元 ) ， 那 么 第 一 个 块 可 能 包含 1、5、9 和 13 单元 ; 第 二 个 块 可 能 包含 2、6、10 
和 14 单元 等 等 。 图 9-6 显示 了 一 个 交织 流 的 单个 丢 包 导致 重建 流 中 的 多 个 小 间 际 ， 这 与 
在 非 交 织 流 中 将 会 导致 单个 大 间 际 形成 对 照 。 
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图 9-6 发送 交 织 音频 


交织 能 够 明显 地 提高 音频 流 可 感觉 到 的 质量 [ Perkins 1998 ] 。 它 的 开销 也 较 低 。 交 织 
明显 的 缺点 是 增加 了 时 延 。 这 限制 了 它 在 如 VoIP 这 样 的 会 话 式 应 用 中 的 使 用 ， 然而 它 能 
够 很 好 地 处 理 流 式 存储 音频 。 交 织 的 一 个 主要 优点 是 它 不 增加 流 的 带宽 需求 。 

3. 差错 掩盖 

差错 掩盖 方案 试图 为 丢失 的 分 组 产生 一 个 与 初始 分 组 类 似 的 蔡 代 物 。 正 如 在 [Perkins 
1998] 中 讨论 的 那样 ， 因 为 音频 信号 (特别 是 语音 ) 呈现 出 大 量 的 短期 自 相 似 性 ， 故 该 
方案 是 可 行 的 。 正 因为 如 此 ， 这 些 技术 适合 于 工作 在 相对 小 的 丢 包 率 〈 低 于 15% ) 和 小 
分 组 (4 ~40ms) 的 情况 。 当 丢失 长 度 接近 音素 的 长 度 (5 ~ 100ms) 时 ， 这 些 技术 就 失效 
了 了， 因为 整个 音素 可 能 被 听 者 错过 。 

也 许 基于 接收 方 的 恢复 的 最 简单 方式 是 分 组 重复 。 即 用 在 丢失 之 前 刚 到 达 的 分 组 的 副 
本 来 代替 丢失 的 分 组 。 这 种 方法 的 计算 复杂 度 低 ， 并 且 工 作 得 相当 好 。 基 于 接收 方 恢复 的 
男 一 种 形式 是 内 插 法 ， 它 使 用 在 丢失 之 前 和 之 后 的 音频 内 插 形 成 一 个 合适 分 组 来 隐藏 丢 
失 。 内 捅 法 比分 组 重复 稍微 好 一 些 ， 但 是 显然 需要 更 高 的 计算 强度 [Perkins 1998 ] 。 


9. 3.4 学 习 案 例 : 使 用 Skype 的 VolP 


Skype 是 一 个 非常 流行 的 VoIP 应 用 ， 每 天 都 有 超过 5000 万 个 活跃 的 账户 。Skype 除了 
提供 主机 到 主机 的 VoIP 服务 ， 还 提供 主机 到 电话 的 服务 ， 电 话 到 主机 的 服务 ， 以 及 多 方 
主机 到 主机 的 视频 会 议 服务 。 (这 里 ， 主 机 仍然 是 任 一 种 因特网 连接 IP 设备 ， 包 括 PC. 
平板 电脑 和 智能 手机 。) Skype F 2011 年 被 微软 公司 收购 。 

因为 Skype 协议 是 专用 的 ， 并 且 因 为 所 有 Skype 的 控制 和 媒体 分 组 是 加 密 的 ， 所 以 精 
确 地 确定 Skype 的 工作 过 程 是 非常 困难 的 。 无 论 如 何 ， 从 Skype 的 Web 网 站 和 几 项 测量 研 
究 ， 研 究 人 员 已 经 知道 了 Skype 总 体 上 是 怎样 工作 的 [Baset 2006; Guha 2006; Chen 
2006; Suh 2006; Ren 2006; Zhang X 2012], 。 对 于 语音 和 视频 ，Skype 客户 都 有 许多 自行 
支配 的 不 同 编 解码 器 ， 这 些 编 解码 器 能 够 以 宽泛 的 速率 和 质量 对 媒体 进行 编码 。 例 如 ， 测 
量 表明 Skype 的 视频 速率 从 用 于 低 质量 会 话 的 低 至 30kbps 到 用 于 高 质量 会 话 的 高 至 1Mbps 


454 RIE 


左右 [Zhang X 2012], — t m A, Skype 语音 质量 好 于 由 有 线 电 话 系 统 提 供 的 “POTS 
(简单 老式 电话 服务 )” 的 质量 。( Skype 编 解 码 器 通常 以 16 000 样本 / 秒 或 更 高 速率 对 语音 
抽样 ， 这 提供 比 POTS 更 为 丰富 的 音色 ，POTS 的 抽样 率 为 8000/ 秒 。) 在 默认 状态 下 ， 
Skype 通过 UDP 发 送 音 频 和 视频 分 组 。 然 而 ， 控 制 分 组 经 TCP 发 送 ， 并 且 当 防火 墙 阻挡 
UDP 流 时 ， 媒 体 分 组 也 通过 TCP 发 送 。Skype 对 于 经 UDP 发 送 的 语音 和 视频 流 使 用 FEC 
处 理 丢 包 恢复 。Skype 客户 还 通过 改变 视频 质量 和 FEC 开销， 使 它 所 发 送 的 音频 和 视频 流 
适应 当前 的 网 络 情况 | Zhang X 2012 |. 

Skype 以 一 些 创新 方式 使 用 P2P 技术 ,很 好 地 曾 述 了 P2P 是 如 何 应 用 于 除 内 容 分 发 和 
文件 共享 之 外 的 应 用 中 的 。 如 同 即 时 讯息 那样 ， 主 机 到 主机 因特网 电话 应 用 的 核心 内 在 地 
应 用 了 P2P 技术 ， 因 为 用 户 对 ( 即 对 等 方 ) 彼此 实时 通信 。 但 是 Skype 也 对 两 个 其 他 重要 
功能 应 用 了 P2P 技术 ， 这 两 个 功能 是 用 户 定 位 和 NAT FR, 

如 图 9-7 所 示 ，Skype 中 的 对 等 方 (EIL) 组 织 成 为 一 个 等 级 制 覆 盖 网 络 ， 其 中 每 个 
对 等 方 分 类 为 超级 对 等 方 和 普通 对 等 方 。Skype 维护 一 个 索引 ， 该 索引 将 Skype 用 户 名 映 
射 为 当前 的 IP 地 址 (和 端口 号 )。 该 索引 经 过 超级 对 等 方 分 发 。 当 Alice 要 呼叫 Bob AT, 
她 的 客户 搜索 该 分 布 式 索引 以 决定 Bob 的 当前 IP 地 址 。 因 为 Skype 协议 是 专用 的 ， 所 以 当 
前 并 不 知道 该 索引 映射 是 怎样 跨越 这 些 超级 对 等 方 进行 组 织 的 ， 尽 管 采用 某 种 形式 的 DHT 
组 织 结构 是 非常 可 能 的 。 

P2P 技术 也 被 用 于 Skype 中 继 (relay) 中 ， 中 继 对 于 创建 家 庭 网 络 中 主机 之 间 的 呼叫 
是 有 用 的 。 许 多 家 庭 网 络 配置 提供 通过 NAT 接 人 因特网 ， 如 第 4 章 所 讨论 的 那样 。 前 面 
讲 过 NAT 防止 来 自家 庭 网 络 外 部 的 主机 发 起 的 对 家 庭 网 络 内 部 主机 的 连接 。 如 果 两 个 
Skype 呼叫 方 都 具有 NAT， 则 存在 一 个 问题 ， 即 任 一 方 都 不 能 接受 由 其 他 一 方 发 起 的 呼叫 ， 
使 得 呼叫 看 起 来 不 可 能 实现 。 明 智 地 使 用 超级 对 等 方 和 中 继 很 好 地 解决 了 这 个 问题 。 假 设 
当 Alice 注册 进入 系统 ， 她 被 指派 了 一 个 非 NAT 的 超级 对 等 方 并 对 那个 超级 对 等 方 发 起 一 
个 会 话 。( 因为 是 Alice 发 起 了 该 会 话 ， 所 以 她 的 NAT 允许 该 会 话 。) 这 个 会 话 允 许 Alice 
和 她 的 超级 对 等 方 交 换 控 制 报 文 。 当 Bob 注册 进入 系统 时 发 生 了 同样 的 事情 。 此 时 ， 当 
Alice 要 呼叫 Bob ， 她 通知 她 的 超级 对 等 方 ， 超 级 对 等 方 依 次 通知 Bob 的 超级 对 等 方 ，Bob 
的 超级 对 等 方 依次 通知 Bob 说 “Alice 
的 入 呼叫 到 了 ”。 如 果 Bob 接受 了 该 呼 
叫 ， 这 两 个 超级 对 等 方 选择 一 个 第 三 
HAE NAT 超级 对 等 方 ( 即 中 继 对 等 
Tr), ， 中 继 对 等 方 的 工作 是 中 继 Alice 
和 Bob 的 数据 。Alice 和 Bob 的 超级 对 
等 方 则 分 别 指示 Alice 和 Bob 与 该 中 继 
发 起 会 话 。 如 图 9-7 所 示 ，Alice 则 经 
过 “Alice 到 中 继 ” 连 接 向 该 中 继 发 送 
语音 分 组 (该 连接 由 Alice 发 起 ) FF 
且 该 中 继 经 “中 继 到 Bob” 连 接 转 发 
这 些 分 组 (该 连接 由 Bob 发 起 ); 从 
Bob 到 Alice 的 分 组 反方 向 地 流 经 相同 
的 两 条 中 继 连 接 。 瞧 ! Bob 和 Alice 有 l 
了 一 条 端 到 端 连接 ， 即 使 他 们 都 不 能 MAT OPNE 
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接受 一 条 源 于 外 部 的 会 话 。 

到 现在 为 止 ， 我 们 有 关 Skype 的 讨论 关注 涉及 两 人 的 呼叫 。 现 在 我 们 观察 多 方 音频 会 
议 呼叫 。 对 于 NW > 2 个 参与 者 ， 如 果 每 个 用 户 希 望 向 每 个 其 他 NN -1 个 用 户 发 送 它 的 音频 
流 的 一 个 副本 ， 则 为 支持 该 音频 会 议 总 共 N(N -1) 个 音频 流 将 需要 发 送 到 网 络 中 去 。 为 
了 减少 这 种 带宽 使 用 ，Skype 应 用 了 一 种 明智 的 发 送 技 术 。 具 体 而 言 ， 每 个 用 户 向 会 议 发 
起 方 发 送 它 的 音频 流 。 会 议 发 起 方 将 这 些 音频 流 结合 为 一 个 流 (基本 上 是 将 所 有 的 音频 信 
号 加 在 一 起 ) ， 然 后 再 向 每 个 其 他 NN - 1 个 参与 者 发 送 每 个 结合 流 的 一 个 副本 。 以 这 种 方 
式 ， 流 的 数量 被 减少 到 2(N-1) 条 。 对 普通 的 两 人 视频 会 议 ，Skype 路 由 对 等 方 到 对 等 方 
呼叫 ， 除 非 需要 NAT 穿越 ， 此 时 呼叫 通过 一 个 非 NAT 对 等 方 中 继 ， 如 前 面 所 述 。 对 于 一 
个 涉及 N >2 个 参与 者 的 视频 会 议 呼 叫 ， 由 于 视频 媒体 的 性 质 ，Skype 不 像 对 语音 呼叫 那 
样 在 一 个 位 置 将 呼叫 结合 进 一 条 流 中 ， 然 后 将 流 回 所 有 参与 者 重新 分 发 。 相 反 ， 每 个 参与 
者 的 视频 流 被 路 由 到 一 个 服务 需 集 群 (2011 年 该 服务 器 集群 位 于 爱沙尼亚 ) ， 该 集群 依次 
将 NW=-1l 个 其 他 参与 者 的 W=-1l 条 流 中 继 到 每 个 参与 者 [Zhang X 2012 ] 。 你 可 能 想 知 道 为 
什么 每 个 参与 者 向 服务 器 而 不 是 向 每 个 其 他 NN - 1 其 他 参与 者 直接 发 送 其 视频 流 的 副本 呢 ? 
的 确 ， 对 两 种 方法 而 言 ，N(N -1) 个 视频 流 正 由 会 议 中 的 个 参与 者 共同 接收 。 其 原因 
是 ， 在 大 多 数 接 入 链 路 中 上 行 链 路 带宽 比 下 行 链 路 带宽 要 低 得 多 ， 上 行 链 路 可 能 不 能 支持 
使 用 P2P 方法 的 入 -1 条 流 。 

诸如 Skype 、QQ 和 Google Talk 等 VoIP 系统 引发 了 对 隐私 性 的 新 关注 。 具 体 而 言 ， 当 
Alice 和 Bob 经 过 VoIP 通信 ，Alice 能 够 嗅 探 到 Bob 的 IP 地 址 ， 进 而 使 用 地 理 定位 服务 
[ MaxMind 2016; Quova 2016] 来 确定 Bob 的 当前 位 置 和 ISP (例如 他 的 工作 或 家 庭 ISP) 。 
事实 上 ，Alice 使 用 Skype 能 够 在 呼叫 创建 期 间 阻挡 特定 的 分 组 传输 ， 这 样 她 获得 Bob 当前 
(比如 说 每 个 小 时 ) 的 地址， 而 Bob 并 不 知道 他 正 被 跟踪 ， 并 且 Alice 不 在 Bob 的 接触 
列表 上 上。 此外， 从 Skype 发 现 的 IP 地 址 能 被 关联 到 在 BitTorrent 中 发 现 的 IP 地 址 ， 因 此 
- Alice 能 够 确定 Bob 正在 下 载 的 文件 [LeBlond 2011 ] 。 此 外 ， 通 过 进行 流 中 分 组 长 度 的 流 
量 分 析 ， 可 能 部 分 解密 一 个 Skype 呼叫 [ White 2011]. 


9.4 实时 会 话 式 应 用 的 协议 


实时 会 话 式 应 用 (包括 VoIP 和 视频 会 议 ) 引人入胜 并 且 非 常 流行 。 因 此 标准 机 构 如 
IETF 和 ITU 多 年 来 一 直 忙 于 (而且 要 继续 忙 下 去 !) 苦心 推敲 这 类 应 用 的 标准 是 毫 不 奇怪 
的 。 借 助 于 实时 会 话 式 应 用 的 适当 标准 ， 各 个 独立 公司 正在 创造 新 的 能 够 互相 操作 的 产 
品 。 在 本 节 中 ， 我 们 探讨 用 于 实时 会 话 式 应 用 的 RTP 和 SIP。 这 两 个 标准 正 广泛 地 应 用 于 
工业 产品 中 。 


9.4.1 RTP 


在 前 一 节 中 ， 我 们 知道 VoIP 应 用 的 发 送 端 在 将 块 传递 给 运输 层 之 前 为 它们 附加 上 首 
部 字段 。 这 些 首部 字段 包括 了 序号 和 时 间 惟 。 因 为 大 多 数 多 媒体 网 络 应 用 能 够 利用 序号 和 
时 间 稚 ， 因 此 有 一 个 包括 音频 /视频 数据 、 序 号 、 时 间 蕉 以 及 其 他 潜在 有 用 字段 的 标准 分 
组 结构 是 方便 的 。 定 义 在 RFC 3550 中 的 RTP 就 是 这 样 一 个 标准 。RTP 能 够 用 于 传输 通用 
格式 ， 如 用 于 声音 的 PCM、ACC 和 MP3 ， 用 于 视频 的 MPEG 和 H. 263。 它 也 可 以 用 于 传输 
专用 的 声音 和 视频 格式 。 目 前 ，RTP 在 许多 产品 和 人 研究 原型 中 得 到 广泛 实现 。 它 也 是 其 他 
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重要 的 实时 交互 协议 (如 STP) 的 补充 。 

本 节 我 们 介绍 RTP。 我 们 也 鼓励 读者 去 访问 Henning Schulzrinne 的 RTP 站 点 [ Schul- 
zrinne- RTP 2012 ] ， 该 网 站 提供 有 关 这 个 主题 的 很 多 信息 。 读 者 也 可 以 访问 RAT 站 点 
[RAT 2012] ， 它 记载 了 使 用 RTP 的 VoIP 应 用 。 

1. RTP 基础 

RTP 通常 运行 在 UDP 之 上 。 发 送 端 在 RTP 分 组 中 封装 媒体 块 ， 然 后 在 UDP 报 文 段 中 
封装 该 分 组 ， 然 后 将 该 报 文 段 递交 给 PP。 接 收 端 从 UDP 报 文 段 中 提取 出 这 个 RTP 分 组 ， 
然后 从 RTP 分 组 中 提取 出 媒体 块 ， 并 将 这 个 块 传递 给 媒体 播放 需 来 解码 和 呈现 。 

举例 来 说 ， 考 虑 使 用 RTP 来 传输 语音 。 假 设 语 音源 采用 了 64kbps 的 PCM 编码 (也 就 
是 采样 、 量 化 和 数字 化 ) 。 再 假设 应 用 程序 在 20ms 块 中 收集 这 些 编码 数据 ， 也 就 是 一 个 块 
中 有 160 字 节 。 发 送 端 在 每 个 语音 数据 块 的 前 面 加 上 一 个 RTP 首部 (RTP header) ， 这 个 
首部 包括 音频 编码 的 类 型 、 序 号 和 时 间 戳 。RTP 首部 通常 是 12 字 节 。 音 频 块 和 RTP 首部 
一 起 形成 RTP 分 组 (RTP packet) 。 然 后 向 UDP 套 接 字 接 口 发 送 该 RTP 分 组 。 在 接收 端 ， 
应 用 程序 从 它 的 套 接 字 接 口 收 到 该 RTP 分 组 ， 从 RTP 分 组 中 提取 出 该 音频 块 ， 并 且 使 用 
RTP 分 组 的 首部 字段 来 适当 地 解码 和 播放 该 音频 块 。 

如 果 一 个 应 用 程序 集成 了 RTP， 而 非 一 种 提供 负载 类 型 、 序 号 或 者 时 间 惟 的 专用 方 
案 ， 则 该 应 用 程序 将 更 容易 和 其 他 网 络 的 多 媒体 应 用 程序 互 操 作 。 例 如 ， 如 果 两 个 不 同 的 
公司 都 开发 VoIP 软件 ， 并 且 都 在 它们 的 产品 中 集成 了 RTP， 则 希望 使 用 一 种 VoIP 产品 的 
用 户 能 够 和 使 用 另 一 种 VoIP 产品 的 用 户 进行 通信 。 在 9.4.2 49, 我 们 将 看 到 RTP 经 常 和 
SIP 一 起 使 用 ，SIP 是 一 种 因特网 电话 的 重要 标准 。 

应 该 强调 的 是 ，RTP 并 不 提供 任何 机 制 来 确保 数据 的 及 时 交付 ， 或 者 提供 其 他 服务 质 
Ht (QoS) 保证 ; 它 甚 至 不 保证 分 组 的 交付 ， 或 防止 分 组 的 失 序 交付 。RTP 封装 的 东西 确 
仅 为 端 系统 所 见 。 路 由 器 不 区 分 携带 RTP 分 组 的 IP 数据 报 和 不 携带 RTP 分 组 的 他 数 
据 报 。 

RTP 允许 为 每 个 源 (例如 一 架 照 相机 或 者 一 个 麦克 风 ) 分 配 一 个 它 自己 的 独立 RTP 
分 组 流 。 例 如 ， 对 于 在 两 个 参与 者 之 间 的 一 个 视频 会 议 ， 可 能 打开 4 个 RIP 流 ， 即 两 个 流 
传输 音频 (一 个 方向 一 个 ) ， 两 个 流传 输 视 频 (也 是 一 个 方向 一 个 ) 。 然 而 ， 在 编码 过 程 
中 很 多 流行 的 编码 技术 (包括 MPEG! 和 MPEG2) 将 音频 和 视频 捆绑 在 单个 流 中 。 当 音频 
和 视频 与 编码 器 捆绑 时 ， 每 个 方 回 只 产生 一 个 RTP 流 。 

RTP 分 组 并 非 限 用 于 单 播 应 用 ， 它 们 也 可 以 经 过 一 对 多 和 多 对 多 的 多 播 树 发 送 。 对 于 
一 个 多 对 多 的 多 播 会 话 ， 所 有 的 会 话 发 送 方 和 源 通常 使 用 同样 的 多 播 组 来 发 送 它们 的 RTP 
流 。 在 一 起 使 用 的 RTP 多 播 流 ， 例 如 在 视频 会 议 应 用 中 从 多 个 发 送 方 发 出 的 音频 和 视频 
流 ， 同 属于 一 个 RTP 会 话 (RTP session), 

2. RTP 分 组 首部 字段 

如 图 9-8 所 示 ，4 个 主要 的 RTP 分 组 首部 字段 是 有 效 载 和 荷 类 型 、 序 号 、 时 间 惟 和 源 标 


识 符 字段 。 


图 9-8 RTP 首部 字段 
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RTP 分 组 中 的 有 效 载 荷 类 型 字段 的 长 度 是 7 比特 。 对 于 音频 流 ， 有 效 载荷 类 型 字段 用 
于 指示 所 使 用 的 音频 编码 类 型 (例如 PCM、 适 应 性 增 量 调制 、 线 性 预测 编码 ) 。 如 果 发 送 
方 在 会 话 过 程 中 决定 改变 编码 ， 发 送 方 可 以 通过 该 有 效 载 荷 类 型 字段 来 通知 接收 方 这 种 变 
化 。 发 送 方 可 能 要 通过 改变 该 编码 来 提高 语音 质量 或 者 减 小 RTP 流 比特 率 。 表 9-2 列 出 了 
当前 RTP 支持 的 一 些 音 频 有 效 载 集 类 型 。 


表 9-2 RIP 支持 的 一 些 音频 有 效 载荷 类 型 


TOTE T 
0 Ba 
oe | o | wa 
a | ai |] un 
7 2 Ak 
ja : 


对 于 一 个 视频 流 ， 有 效 载 傈 类 型 用 于 指示 视频 编码 类 型 (例如 运动 JPEG, MPEG1 , 
MPEG2、H. 261 ) 。 发 送 方 也 可 以 在 会 话 期 间 动 态 改 变 视频 编码 。 表 9-3 列 出 了 当前 RTP 
文 持 的 一 些 视 频 有 效 载 集 类 型 。 


表 9-3 RTP 支持 的 一 些 视频 有 效 载荷 类 型 


其 他 重要 的 字段 如 下 : 

e 序号 字段 。 序 号 字段 长 为 16 比特 。 每 发 送 一 个 RTP 分 组 则 该 序号 增加 1， 而 且 接 
收 方 可 以 用 该 序号 来 检测 丢 包 和 恢复 分 组 序列 。 例 如 ， 如 果 应 用 的 接收 方 收 到 的 
RTP 分 组 流 在 序号 86 和 89 之 间 存 在 一 个 间隙， 那么 接收 方 则 知道 分 组 87 和 88 E 
失 了 。 那 么 接收 方 能 够 设法 来 隐藏 该 丢失 数据 。 

。 时 间 改 字段 。 时 间 惟 字段 长 32 比特 。 它 反映 了 RTP 数据 分 组 中 的 第 一 个 字 节 的 采 
样 时 刻 。 如 我 们 在 上 一 节 所 见 ， 接 收 方 能 够 使 用 时 间 惟 来 去 除 网 络 中 引入 的 分 组 
时 延 抖 动 ， 提 供 接收 方 的 同步 播放 。 时 间 惟 是 从 发 送 方 的 采样 时 钟 中 获得 的 。 举 
例 来 说 ， 对 于 音频 的 每 个 采样 周期 (例如 对 于 8kHz 的 采样 时 钟 每 125us 为 一 个 周 
期 ) 时 间 惟 时 钟 增加 1; 如 果 该 音频 应 用 产生 由 160 个 编码 采样 组 成 的 块 的 话 ， 那 
么 当 源 激活 时 ， 对 每 个 RTP 分 组 则 时 间 惟 增加 160。 即 使 源 未 激活 ， 该 时 间 惟 时 
钟 也 将 继续 以 恒定 速率 增加 。 

© 同步 源 标 识 符 (SSRC)。SSRC 字段 长 为 32 比特 。 它 标识 了 RIP 流 的 源 。 通 常 在 
RTP 会 话 中 的 每 个 流 都 有 一 个 不 同 的 SSRC。SSRC 不 是 发 送 方 的 I 地址， 而 是 当 
新 的 流 开始 时 源 随机 分 配 的 一 个 数 。 两 个 流 被 分 配 相 同 SSRC 的 概率 是 很 小 的 。 如 
果 发 生 了 ， 这 两 个 源 应 当选 择 一 个 新 的 SSRC 值 。 


9.4.2 SIP 










有 效 载荷 类 型 编号 





MPEGI 视频 
MPEG2 视频 









定义 在 | RFC 3261; RFC 5411] 中 的 会 话 发 起 协议 (Session Initiation Protocol, SIP) 
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是 一 个 开放 和 轻型 的 协议 ， 其 功能 如 下 : 
o 提供 了 在 主 叫 者 和 被 叫 者 之 间 经 IP 网 络 创建 呼叫 的 机 制 。 它 允许 主 叫 者 通知 
被 叫 者 它 要 开始 一 个 呼叫 。 它 允许 参与 者 约定 媒体 编码 ， 也 允许 参与 者 结束 
呼叫 。 
o 提供 了 主 叫 者 确定 被 叫 者 的 当前 IP 地 址 的 机 制 。 因 为 用 户 可 能 动态 地 分 配 到 地 址 
(使 用 DHCP) ， 而 且 因为 它们 可 能 有 多 个 P 设备 ， 每 个 都 有 一 个 不 同 的 IP 地 址 ， 
所 以 用 户 不 具有 单一 的 、 固 定 的 IP 地 址 。 
。 提供 了 用 于 呼叫 管理 的 机 制 ， 这 些 机 制 包括 在 呼叫 期 间 增 加 新 媒体 流 、 在 呼叫 期 
间 改 变 编 码 、 在 呼叫 期 间 邀 请 新 的 参与 者 、 呼 叫 转移 和 呼叫 保持 等 。 
1. WEA IP 地 址 建立 一 个 呼叫 
为 了 理解 SIP 的 要 素 ， 最 好 看 一 个 具体 的 例子 。 在 这 个 例子 中 ，Alice 在 使 用 PC， 并 
且 她 要 呼叫 Bob ，Bob 也 在 使 用 PC 工作 。Alice 和 Bob 的 PC 都 配 有 基于 SIP 的 软件 来 产生 
和 接收 电话 呼叫 。 在 这 个 初始 的 例子 中 ， 我 们 将 假设 Alice 知道 Bob PC fy IP Hit, Al 9-9 
描述 了 这 个 SIP 呼叫 建立 的 过 程 。 





a 193.64.210.89 
INVITE bob@193.64.210 89 
oN IP4 167.180.11224 ， 

~audio 38060 RTP/AVp 0 3 

端口 5060 ` 
200 OK 10.89 ene 

coIN 1P4 193.6420 DS | 

| mr” 48753 RIP/A 

` 端口 5060 

ACK 

端口 5060 : 

h 律 音频 

: 端口 38060 : 

; GSM 3 

: v 
时 间 lw 


K 9-9 ~4 Alice 知道 Bob 的 IP 地 址 时 的 SIP 呼叫 建立 过 程 


在 图 9-9 中 ,我 们 看 到 当 Alice 给 Bob 发 送 一 个 INVITE RX (这 类 似 于 HTTP 请 求 报 
X) AY, 一 个 SP 会 话 开始 了 。 该 INVITE 报 文通 过 UDP 发 送 给 SIP 的 周知 端口 5060, (SIP 
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报 文 也 可 以 经 TCP AIK.) WW INVITE 报 文 包括 了 对 Bob 的 标识 〈bob@ 193. 64. 210. 89) 、 
Alice 当前 IP 地 址 的 指示 、Alice 希望 接收 的 音频 的 指示 (该 音频 以 格式 AVP 0 编码 ， 即 pu 
律 PCM 编码 ， 并 在 RTP 中 封装 )， 以 及 她 希望 在 端口 38060 接收 RTP 分 组 的 指示 。 在 收 
到 了 Alice 的 INVITE 报 文 之 后 ，Bob 发 送 一 个 SIP 啊 应 报 文 (该 报 文 类 似 HTTP 的 啊 应 报 
文 ) 。 该 响应 SIP 报 文 也 被 发 送 到 SIP HG 5060, Bob 的 啊 应 包括 一 个 200 OK 和 他 的 了 下地 
址 的 指示 、 他 和 希望 接收 的 编码 和 分 组 化 ， 以 及 音频 数据 应 该 发 送 到 达 的 端口 号 。 注 意 到 在 
这 个 例子 中 ，Alice 和 Bob 准备 使 用 不 同 的 音频 编码 机 制 : 要 求 Alice 使 用 GSM 来 对 她 的 
音频 编码 ， 而 要 求 Bob 使 用 GE PCM 对 他 的 音频 编码 。 在 接收 到 Bob 的 啊 应 后 ，Alice [a] 
Bob 发 送 SIP 确认 报 文 。 在 这 个 SIP 事务 之 后 ，Bob 和 Alice 可 以 交谈 了 。 (为 了 看 起 来 清 
晰 ， 图 9-9 显示 Alice 在 Bob 之 后 说 话 ， 但 是 事实 上 他 们 通常 可 以 同时 进行 交谈 。) Bob 会 
根据 要 求 对 音频 进行 编码 和 分 组 化 ， 并 将 音频 分 组 发 送 给 IP 地 址 167. 180. 112. 24 的 端口 
号 38060。Alice 也 会 根据 要 求 对 音频 进行 编码 和 分 组 化 ， 并 将 音频 分 组 发 送 给 IP 地 址 
193. 64. 210. 89 的 端口 号 48753。 

从 这 个 简单 的 例子 我 们 学 到 了 一 些 SIP 的 关键 特性 。 第 一 ，SIP 是 一 个 带 外 协议 ， 即 
发 送 和 接收 SIP 报 文 使 用 了 一 个 不 同 于 发 送 和 接收 媒体 数据 的 套 接 字 。 第 二 ，SIP 报 文本 
身 是 可 读 的 ASCI， 这 与 HTTP 报 文 类 似 。 第 三 ，SIP 要 求 所 有 的 报 文 都 要 确认 ， 因 此 它 能 
够 在 UDP 或 者 TCP 上 运行 。 

在 这 个 例子 中 ， 我 们 考虑 一 下 如 果 Bob 没有 上 律 PCM 编 解码 器 用 于 音频 编码 将 会 发 
生 什么 情况 。 在 这 种 情况 下 ，Bob 不 用 200 OK 来 响应 ， 而 可 能 用 一 个 606 Not Acceptable 
(不 可 接受 ) 来 啊 应 ， 并 在 报 文中 列 出 他 能 够 使 用 的 所 有 编 解 码 。 然 后 Alice 从 中 选择 一 个 
编 解 码 ， 并 发 送 另 一 个 INVITE 报 文 ， 以 此 通告 了 已 选择 的 编 解 码 器 。Bob 也 能 够 直接 通 
过 发 送 某 个 拒绝 应 答 代 码 来 直接 拒绝 该 呼叫 。 (有 很 多 这 种 代码 ， 包括 “busy 〈 忙 )” 
“gone (离开 )”“payment (付费 )” 和 “forbidden (禁止 )”。) 

2. SIP 地 址 


在 前 面 的 例子 中 ，Bob 的 SIP 地 址 是 sip; bob@ 193. 64. 210. 89。 然 而 ， 我 们 希望 许多 
(即使 不 是 大 多 数 ) SIP 地 址 类 似 于 电子 邮件 地 址 。 例 如 ，Bob 的 地 址 可 以 是 sip: bob@ 
domain. com, “4 Alice 的 SIP 设备 发 送 INVITE 报 文 ， 该 报 文 包括 这 种 类 似 于 电子 邮件 地 址 
的 地 址 ; 然后 SIP 的 基本 设施 将 该 报 文 转发 给 Bob 正在 使 用 的 IP 设备 〈 如 我 们 下 面 要 讨 
论 的 那样 ) 。 其 他 可 能 的 SIP 地 址 形式 可 以 是 Bob 过 去 的 电话 号 码 或 者 只 是 Bob 的 名 字 / 中 
间 名 /姓氏 〈 假 设 它 是 唯一 的 ) 。 

SIP 地 址 的 一 个 有 趣 特点 是 它们 能 够 被 包括 在 Web 页 面 中 ， 就 像 人 们 的 电子 邮件 地 址 
用 mailto URL 形式 包含 在 Web 页 面 中 那样 。 例 如 ， 假 设 Bob 有 个 人 主页 ， 并 且 他 要 为 这 
个 主页 的 访问 者 提供 一 个 呼叫 他 的 方法 。 于 是 他 可 能 只 是 在 主页 中 包括 该 URL sip: bob@ 
domain. com。 当 访问 者 点 击 该 URL， 访 问 者 设备 中 的 SIP 应 用 将 启动 ， 并 向 Bob 发 送 IN- 
VITE 报 文 。 

3. SIP 报 文 


在 这 个 SIP 简短 的 介绍 中 ， 我 们 无 法 包括 所 有 SIP 报 文 类 型 和 首部 ， 而 只 是 简要 地 浏 
览 一 下 SIP INVITE 报 文 ， 以 及 少数 通用 的 首部 行 。 我 们 再 假设 Alice 要 对 Bob 发 起 VoIP 呼 
叫 ， 此 时 Alice 只 知道 Bob 的 SIP 地 址 bob@ domain. com， 并 不 知道 Bob 正在 使 用 的 设备 的 
IP 地 址 。 那 么 她 的 报 文 可 能 看 起 来 有 些 像 下 面 这 个 : 
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INVITE sip:bob@domain.com SIP/2.0 
Via: SIP/2.0/UDP 167.180.112.24 
From: sip:alice@hereway.com 

To: sip:bob@domain.com 

Call-ID: a2e3a@pigeon.hereway.com 
Content-Type: application/sdp 
Content-Length: 885 


c=IN IP4 167.180.112.24 
m=audio 38060 RTP/AVP 0 


这 个 INVITE 行 包括 SIP 的 版 本 ， 这 与 HTTP 请 求 报 文 一 样 。 任 何 时 候 SIP 报 文通 过 一 
个 SIP 设备 〈 包 括 产生 该 报 文 的 设备 ) 时 ， 它 附加 上 一 个 Via 首部 来 指示 该 设备 的 IP 地 
址 。( 我 们 不 久 将 看 到 通常 INVITE 报 文 在 到 达 被 叫 者 的 SIP 应 用 之 前 会 通过 很 多 SIP 设 
Ko) 与 电子 邮件 报 文 类 似 ，SIP 报 文 包括 一 个 From 首部 行 和 一 个 To 首部 行 。 该 报 文 包括 
一 个 Call-ID (呼叫 标识 符 )， 它 唯一 地 标识 该 呼叫 ( 类似 电 子 邮 件 中 的 报 文 中); 包括 一 
个 Content-Type ( 内容 类 型 ) 首部 行 ， 定义 用 于 描述 包含 在 SIP 报 文中 的 内 容 的 格式 ; 还 
包括 Content-Length ( 内容 长 度 ) 首部 行 ， 提 供 报 文中 内 容 的 字 节 长 度 。 最 后 ， 在 一 个 回 
车 和 换行 之 后 ， 该 报 文 包 含 内 容 部 分 。 在 这 个 例子 中 ， 内 容 提 供 了 有 关 Alice 的 IP 地 址 和 
Alice 要 如 何 接收 该 音频 的 信息 。 

4. 名 字 翻 译 和 用 户 定位 

在 图 9-9 的 例子 中 ， 我 们 假设 Alice 的 SIP 设备 知道 能 够 联系 到 Bob 的 IP 地 址 。 但 是 
这 种 假设 是 很 不 真实 的 ， 不 仅 因为 IP 地 址 通常 是 通过 DHCP 动态 分 配 的 ， 而 且 Bob 可 能 
有 多 个 IP 设备 (例如 ， 在 家 里 、 工 作 中 和 汽车 里 有 不 同 的 设备 )。 因 此 现在 我 们 假设 
Alice 只 知道 Bob 的 电子 邮件 地 址 bob@ domain. com， 而 且 对 基于 SIP 的 呼叫 使 用 同样 的 地 
址 。 在 这 种 情况 下 ，Alice 需要 获得 用 户 bob@ domain. com 正在 使 用 的 设备 的 IP 地 址 。 为 
了 获得 它 ，Alice 创建 一 个 INVITE 报 文 ， 它 以 INVITE bob@ domain. com SIP/2.0 开始 ， 并 
将 该 报 文 发 送 给 一 个 SIP 代理 (SIP proxy ) 。 该 代理 将 以 一 个 SIP 回答 来 啊 应 ， 该 回答 中 
也 可 能 包含 bob@ domain. com 正在 使 用 的 设备 的 卫 地 址 。 该 回答 也 可 以 选择 包括 Bob 的 语 
音信 箱 的 IP 地址 ， 或 者 可 能 包括 一 个 Web 页 面 的 URL (上面 写 着 “Bob 在 睡觉 ， 请 不 要 
打扰 !”) 。 代 理 返回 的 结果 也 可 能 取决 于 呼叫 者 : 如 果 呼 叫 是 Bob 的 妻子 发 出 的 ， 它 可 能 
接受 该 呼叫 ， 并 提供 IP 地 址 ; 如 果 呼 叫 是 Bob 的 岳母 发 出 的 ， 它 可 能 用 指向 “我 正在 睡 
觉 ” 的 Web WAY URL 来 啊 应 。 

现在 ， 你 可 能 想 知道 这 个 代理 服务 器 是 怎样 确定 bob@ domain. com 现在 的 IP 地 址 的 ? 
为 了 回答 该 问题 ， 我 们 需要 讲 一 下 另 一 个 SIP 设备 ， 即 SIP 注册 器 (SIP registrar), 474 
SIP 用 户 都 有 一 个 相关 联 的 注册 器 。 任 何 时 候 用 户 在 设备 上 发 起 SIP 应 用 时 ， 该 应 用 给 注 
册 器 发 送 一 个 SIP 注册 报 文 ， 通 知 注册 器 它 现 在 的 IP 地 址 。 例 如 ， 当 Bob 在 他 的 PDA 上 
发 起 SIP 应 用 时 ， 该 应 用 将 发 送 一 个 类 似 于 下 述 内 容 的 报 文 : 


REGISTER sip:domain.com SIP/2.0 
Via: SIP/2.0/UDP 193.64.210.89 
From: sip:bob@domain.com 

To: sip:bob@domain.com 

Expires: 3600 


Bob 的 注册 器 跟踪 Bob 现在 的 IP 地址 。 无 论 何 时 Bob 切换 到 一 个 新 的 SIP 设备 时 ， 该 
新 设备 将 发 送 一 个 新 的 注册 报 文 ， 指 示 该 新 的 全 地 址 。 如 果 Bob 长 时 间 使 用 同样 的 设备 ， 
该 设备 将 发 送 刷 新 注册 报 文 ， 指 示 最 近 发 送 的 IP 地 址 仍然 有 效 。( 在 上 面 的 例子 中 ,需要 
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fa 3000 秒 发 送 刷 新 报 文 来 维护 在 注册 右 中 的 地 址 。) 值得 注意 的 是 注册 器 和 DNS 权威 
FAR ARAM: DNS 服务 器 将 固定 的 用 户 名 翻译 到 固定 的 IP 地址 ; SIP 注册 器 把 固定 的 
人 识别 标志 (例如 bob@ domain. com) 翻译 为 一 个 动态 的 IP Hott. SIP 注册 器 和 SIP 代理 
通常 运行 在 同一 台 主 机 上 。 

现在 我 们 检查 一 下 Alice 的 SIP 代理 服务 器 是 如 何 获 得 Bob 当前 的 IP 地 址 的 。 从 上 面 
的 讨论 我 们 看 到 ， 代 理 服 务 器 只 需要 转发 Alice 的 INVITE 报 文 给 Bob 的 注册 器 /代理 即 可 。 
然后 注册 器 /代理 将 该 报 文 转发 给 Bob 现在 的 SIP 设备。 最 后 ， 在 已 收 到 了 Alice 的 INVITE 
报 文 之 后 ，Bob 可 以 向 Alice 发 送 一 个 SIP 应 答 。 

举例 来 说 ， 考 虑 图 9-10， 其 中 正在 217. 123. 56. 89 上 工作 的 jim@ umass. edu 要 对 正在 
197. 87. 54.21 上 工作 的 keith@ upenn. edu 发 起 IP 语音 (VoIP) 会 话 。 采 用 下 面 的 步骤 : 
(DJim 向 umass 的 SIP 代理 发 送 INVITE 报 文 。 四 该 代理 在 SIP 注册 器 upenn. edu 上 进行 
DNS 查询 (在 图 中 没有 显示 ) ， 并 将 该 报 文 转发 给 注册 服务 器 。@ 因 为 keith@ upenn. edu 
没有 在 注册 器 upenn 上 注册 ，upenn 注册 需 发 送 一 个 重 定 向 应 答 ， 指 示 它 应 该 试 一 试 
keith@ nyu. edu, @umass 的 代理 向 NYU 的 SIP 注册 器 发 送 INVITE 报 文 。G@ONYU 注册 器 知 
道 keith @ upenn. edu 的 IP 地 址 ， 并 将 SIP 注 册 器 
INVITE 报 文 转发 给 正 运行 Keith 的 SIP 客 upenn.edu 
户 的 主机 197. 87.54.21, © ~ 图 通过 注册 
器 /代理 把 SIP 啊 应 返回 给 217. 123. 56. 89 
上 的 SIP 客户 。@@ 媒 体 直 接 在 两 个 客户 之 
间 发 送 。 (还 有 一 个 SIP 确认 报 文 ， 图 中 
没有 画 出 来 。) 


我 们 有 关 SIP 的 讨论 集中 在 语音 呼叫 
的 呼叫 发 起 方面 。SIP 通常 是 一 个 发 起 和 <_0——_“8 
“结束 呼叫 的 信 令 协议 ， 它 能 够 用 于 视频 会 
议 呼叫 和 基于 文本 的 会 话 。 事 实 上 ，SIP © 


SIP 注 册 器 
nyu.edu 














已 经 成 为 许多 即时 讯息 应 用 的 基本 组 件 。 (8) 

我 们 鼓励 布 望 学 习 更 多 有 关 SIP 知识 的 读 

者 访问 Henning Schulzrinne 的 SIP Web 站 (9) 

点 [ Schulzrinne-SIP 2016 |] 。 特 别 是 ， 你 在 

这 个 站 点 上 会 发 现 SIP 客户 和 服务 器 的 开 | SRP Rae 


源 软件 [SIP Software 2016 ] 。 


9.5 支持 多 媒体 的 网 络 


在 9.2~9.4 节 中， 我 们 学 习 了 诸如 客户 缓存 、 预 取 、 对 可 用 带宽 的 适应 性 媒体 质量 、 
适应 性 播放 和 丢 包 缓解 技术 等 应 用 级 机 制 如 何 用 于 多 媒体 应 用 ， 以 改善 多 媒体 应 用 的 性 
能 。 我 们 也 学 习 了 内 容 分 发 网 和 P2P 覆盖 网 络 如 何 用 于 提供 系统 级 的 交付 多 媒体 内 容 的 方 
法 。 这 些 技术 和 方法 都 被 设计 用 于 今天 的 尽力 而 为 因特网 。 的 确 ， 现 在 因特网 得 到 应 用 就 
是 因为 它 只 提供 单一 的 、 尽 力 而 为 类 型 的 服务 。 但 是 作为 计算 机 网 络 的 设计 者 ， 我 们 禁 不 
住 要 问 : 网 络 (而 不 是 应 用 程序 或 者 仅 应 用 级 的 基础 设施 ) 是 否 可 以 提供 支持 多 媒体 内 容 
交付 的 机 制 。 如 我 们 很 快 将 看 到 的 那样 ， 答 案 当 然 是 肯定 的 ! 但 是 我 们 也 将 看 到 ， 许 多 这 


图 9-10 涉及 SIP 代理 与 注册 器 的 会 话 发 起 
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样 的 新 网 络 级 机 制 还 没有 得 到 广泛 部 署 。 这 可 能 是 由 于 它们 的 复杂 性 和 下 列 事实 所 致 : 应 
用 级 基础 设施 以 及 尽力 而 为 服务 和 适当 定制 的 网 络 资源 (例如 带宽 ) 的 确 能 够 提供 “ 足 
够 好 的 ”( 即使 不 总 是 尽善尽美 的 ) 端 到 端 多 媒体 交付 服务 。 

表 9-4 总 结 了 能 够 对 多 媒体 应 用 提供 网 络 层 支持 的 三 种 宽泛 的 方法 。 


表 9-4 支持 多 媒体 应 用 的 三 种 网 络 层 方法 














尽 可 能 利用 尽 | ”公平 处 理 所 有 | HAXH, CDN, W a 
力 而 为 服务 流量 ARAK 盖 网 络 ， 网 络 级 资源 供给 大 处 不 在 
不 同类 型 的 流 Sg 
每 连接 服务 质 | ”每 个 源 到 目的 | 一旦 流 被 准 入 ，| ”分 组 标识 ， 监 管 ， 调 
量 (Qos) 保证 | 地 流 处 理 不 同 | 软 或 者 硬 Ke, UE ME ARES 









© 尽 可 能 利用 尽力 而 为 服务 。 我 们 在 9. 2 ~ 9. 4 节 学 习 的 应 用 级 机 制 和 基础 设施 能 够 
成 功 地 用 于 定制 良好 的 网 络 一 一 该 网 络 中 偶然 出 现 丢 包 和 过 大 的 端 到 端 时 延 。 当 
预见 到 需求 增加 ，ISP 部 署 额 外 的 带宽 和 交换 能 力 以 持续 确保 满意 的 时 延 和 丢 包 性 
能 [Huang 2005 ] 。 我 们 将 在 9.5.1 节 中 进一步 讨论 网 络 定 制 (network dimensio- 
ning) o 
区 分 服务 。 自 因特网 的 早期 ， 就 已 经 设想 不 同类 型 的 流量 〈 例 如 ， 在 IPv4 分 组 让 
部 中 服务 类 型 字段 所 指示 的 类 型 ) 能 够 由 不 同类 型 的 服务 所 提供 ， 而 不 是 单一 的 
“以 不 变 应 万 变 ” 的 尽力 而 为 服务 。 使 用 区 分 服务 (differentiated service), p% 
流量 在 一 台 路 由 器 中 排队 时 ， 一 种 类 型 的 流量 可 以 给 定 严 格 的 优 于 另 一 种 类 型 的 
流量 的 优先 权 。 例 如 ， 属 于 实时 会 话 式 应 用 的 分 组 由 于 其 严格 的 时 延 限制 ， 可 能 
会 给 定 优 于 其 他 分 组 的 优先 权 。 在 网 络 中 引 和 人 区 分 服务 将 要 求 一 些 用 于 分 组 标记 
(指示 一 个 分 组 的 服务 类 型 )、 分 组 调度 和 其 他 方面 的 新 机 制 。 我 们 将 在 9.5.2 市 
和 9.5.3 节 中 涉及 区 分 服务 以 及 实现 这 种 服务 的 新 网 络 机 制 。 
© 每 连接 服务 质量 (QoS) 保证 。 使 用 每 连接 QoS 保证， 每 个 应 用 的 实例 显 式 地 预 
约 端 到 端 带宽 ， 并 因此 具有 确保 的 端 到 端 性 能 。 硬 保证 (hard guarantee) 意味 着 
应 用 将 必定 接收 到 它 所 请 求 的 服务 质量 。 软 保证 (soft guarantee) 意味 着 应 用 将 以 
高 概率 接收 到 它 所 请 求 的 服务 质量 。 例 如 ， 如 果 某 用 户 要 从 主机 A 向 主机 B 进行 
VoIP 呼叫 ， 该 用 户 的 VoIP 应 用 在 两 台 主机 之 间 沿 着 路 径 在 每 条 链 路 上 显 式 地 预 留 
带宽 。 但 是 ， 人 允许 应 用 做 预约 和 请 求 网 络 同意 该 预约 ， 这 需要 一 些 大 的 变化 。 首 
. 先 ， 我 们 需要 一 个 协议 来 代表 应 用 程序 ， 从 发 送 方 到 其 接收 方 沿路 径 预 约 链 路 带 
宽 。 第 二 ,在 路 由 器 队列 中 将 需要 新 的 调度 策略 ,使 每 连接 带宽 预约 能 够 兑现 。 
最 后 ， 为 了 进行 预约 ， 应 用 程序 必须 向 网 络 给 出 描述 来 说 明 它 们 和 硕 望 发 送 进 网 络 
的 流量 ， 并 且 网 络 将 需要 监管 每 个 应 用 程序 的 流量 以 确保 它 遵守 这 个 描述 。 当 这 
些 机 制 结合 时 ， 在 主机 和 路 由 器 中 要 求 新 的 和 复杂 的 软件 。 因 为 每 连接 QoS 保证 
服务 尚未 见 到 大 规模 部 署 ， 我 们 将 仅 在 9. 5. 4 节 中 简要 地 涉及 这 些 机 制 。 


9.5.1 定制 尽力 而 为 网 络 
从 根本 上 说 ， 支 持 多 媒体 应 用 的 困难 是 由 其 严格 的 性 能 要 求 引 起 的 ， 即 低 的 端 到 端 分 
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组 时 延 、 时 延 抖动 和 丢 包 ， 而 事实 是 ， 无 论 何 时 网 络 变 得 拥塞 ， 都 将 出 现 较 大 的 分 组 时 
延 、 时 延 抖 动 和 丢 包 。 改 善 多 媒体 应 用 质量 的 第 一 种 方法 就 是 “在 问题 上 砸 钱 ”， 因 此 直 
接 避 免 资 源 竞 争 即 可 。 这 种 方法 常用 于 解决 有 关 资 源 受 限 的 任何 问题 。 在 网 络 多 媒体 的 场 
合 ， 这 意味 着 在 整个 网 络 中 提供 充足 的 链 路 带宽 ， 使 网 络 拥塞 及 其 导致 的 分 组 时 延 和 丢失 
决 不 会 (或 仅 非 常 少 地 ) 出 现 。 具 有 充足 的 链 路 带宽 ， 分 组 将 很 快 地 通过 今天 的 因特网 而 
没有 排队 时 延 或 丢失 。 从 许多 方面 看 ， 这 是 一 种 理想 的 情况 : 完美 地 执行 多 媒体 应 用 ， 用 
户 是 幸运 的 ， 所 有 要 求 都 能 够 满足 而 不 改变 因特网 尽力 而 为 的 体系 结构 。 
当然 ， 问 题 是 为 实现 这 种 极乐 世界 提供 多 大 容量 才 是 “充足 的 "， 以 及 提供 “充足 
的 ”带宽 的 成 本 从 ISP 的 商业 角度 来 说 是 否 实际 。 在 一 个 给 定 拓扑 中 为 网 络 链 路 提供 多 大 
容量 以 取得 给 定 水 平 的 性 能 的 问题 常 被 称 为 带宽 供给 (bandwidth provisioning)。 如 何 设计 
一 个 网 络 拓扑 〈 其 中 放置 一 些 路 由 器 ， 如 何 用 链 路 互联 这 些 路 由 器 ， 并 为 链 路 分 配 容 量 ) 
以 取得 给 定 水 平 的 端 到 端 性 能 这 个 更 为 复杂 的 问题 常 被 称 为 网 络 定制 ( network dimensio- 
ning) 。 市 宽 供 给 和 网 络 定制 都 是 复杂 的 专题 ， 它 们 远 超 过 了 本 教科 书 的 范围 。 然 而 ， 我 
们 这 里 注意 到 ， 为 了 预测 两 个 网 络 端点 之 间 的 应 用 级 性 能 ， 必 须 处 理 下 列 问题 ， 并 因此 提 
供 充 足 的 容量 来 满足 应 用 的 性 能 要 求 。 
© 网 络 端点 之 间 的 流量 需求 模型 。 这 些 模型 可 能 需要 定义 在 呼叫 层次 (例如 ， 用 户 
“到 达 ” 网 络 并 局 动 端 到 端 应 用 ) 和 分 组 层次 (例如 ， 由 进行 中 的 应 用 所 产生 的 
分 组 ) 。 注 意 负载 可 能 随 着 时 间 而 变化 。 
© 定义 良好 的 性 能 要 求 。 例 如 ， 为 文 持 诸如 会 话 式 多 媒体 应 用 等 时 延 敏 感 的 流量 ， 
其 性 能 要 求 可 能 是 : 分 组 的 端 到 端 时 延 大 于 最 大 可 容忍 时 延 的 概率 要 小 于 某 个 很 
小 的 值 [Fraleigh 2003 | 。 
© 对 给 定 的 负载 模型 预测 端 到 端 性 能 的 模型 ， 以 及 求 出 最 小 成 本 带宽 分 配 (该 带宽 
分 配 将 导致 满足 所 有 用 户 的 需求 ) 的 技术 。 这 里 ， 研 究 人 员 正 忙于 研发 能 够 量化 
给 定 负 载 下 的 性 能 的 性 能 模型 ， 以 及 能 求 出 满足 性 能 要 求 的 最 小 成 本 带宽 分 配 的 
优化 技术 。 
假定 今天 尽力 而 为 的 因特网 能 够 ( 从 技术 角度 讲 ) 以 适当 的 性 能 水 平 支 持 多 媒体 流量 
( 如果 它 被 定制 成 这 样 的 话 ) ， 自 然 的 问题 是 为 什么 今天 的 因特网 满足 不 了 这 样 的 要 求 。 答 
案 基 本 上 是 经 济 上 和 组 织 上 的 原因 。 从 经 济 角度 看 ， 用 户 将 愿意 向 其 ISP 支付 足够 多 的 费 
用 ,使 ISP 安装 充足 的 带宽 经 尽力 而 为 的 因特网 来 文 持 多 媒体 应 用 吗 ? 组织 问题 也 许 更 为 
令 人 气 包 。 注 意 到 在 两 个 多 媒体 端点 之 间 的 端 到 端 路 径 将 通过 多 个 ISP 的 网 络 。 从 组 织 角 
REA, XE IP 将 愿意 合作 (也 许 以 收入 共享 方式 ) 以 确保 端 到 端 路 径 被 适当 地 定制 来 文 
持 多 媒体 应 用 吗 ? 对 这 些 经 济 和 组 织 问题 的 展望 ， 参 见 [Davies 2005 ] 。 对 于 供给 第 一 层 
主干 网 络 以 支持 时 延 敏感 流量 的 展望 ， 参 见 [Fraleigh 2003 ] 。 


9.5.2 提供 多 种 类 型 的 服务 


也 许 对 今天 因特网 中 的 以 不 变 应 万 变 的 尽力 而 为 服务 而 言 ， 一 种 最 简单 的 强化 是 将 流 
量 划 分 为 多 种 类 型 ， 并 为 这 些 不 同类 型 的 流量 提供 不 同等 级 的 服务 。 例 如 ， 某 ISP 可 能 要 
为 时 延 敏感 的 VoIP 或 电信 会 议 流量 比 为 电子 邮件 或 HTTP 等 弹性 流量 提供 更 高 的 服务 类 
型 (并 对 该 服务 收取 更 高 的 费用 ) 。 男 一 种 做 法 是 ，ISP 可 能 直接 向 愿意 对 这 种 改进 服务 
文 付 更 多 费用 的 顾客 提供 更 高 质量 的 服务 。 一 些 住 宅 有 线 接 人 ISP 和 蜂窝 无 线 接 入 ISP 已 
经 采用 了 这 样 的 梯次 等 级 服务 ， 即 铂金 卡 服务 用 户 比 金 卡 服务 用 户 或 银 卡 服务 用 户 享有 更 
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好 的 服务 性 能 。 

我 们 都 从 日 常生 活 中 熟悉 了 不 同类 型 的 服务 ， 如 航班 上 头等 舱 乘 客 比 公务 舱 乘 客 得 到 
更 好 的 服务 ， 公 务 舱 乘客 又 比 经 济 舱 乘客 得 到 更 好 的 服务 ;VIP 在 活动 中 能 够 立即 进入 ， 
而 所 有 其 他 人 都 必须 排队 等 待 ; 在 某 些 国家 中 老年 人 被 尊重 ,提供 了 荣誉 座位 和 最 精细 的 
食物 。 重 要 的 是 注意 到 在 聚合 流量 中 ( 即 在 多 种 流量 类 型 中 而 不 是 单个 连接 中 ) 提供 了 这 
种 有 差别 的 服务 。 例 如 ， 所 有 头等 舱 乘 客 被 一 视 同 仁 (没有 哪个 头等 舱 乘客 得 到 了 比 其 他 
头等 舱 乘 客 更 好 的 服务 ) ， 就 像 所 有 的 VoIP 分 组 在 网 络 中 得 到 了 相同 的 对 待 ， 与 它们 所 属 
的 特定 的 端 到 端 连接 无 关 。 如 我 们 将 见 到 的 那样 ， 通 过 处 理 少量 的 流量 聚合 ， 而 不 是 大 量 
的 单个 连接 ， 提 供 好 于 尽力 而 为 服务 所 需要 的 新 型 网 络 机 制 能 够 保持 相对 简单 。 

早期 因特网 设计 者 的 心中 清晰 地 具有 这 种 多 种 类 型 服务 的 概念 。 回 想 第 4 章 中 IPv4 首 
部 中 的 服务 类 型 (ToS) 字段 。IEN123 [ISI 1979] 描述 也 呈现 在 IPv4 数据 报 的 原型 中 的 
ToS 字段 时 说 : “服务 类 型 [字段 ] 提供 了 所 希望 的 服务 质量 的 抽象 参数 的 指示 。 当 传输 
一 个 数据 报 通过 某 特 定 网 络 时 ， 这 些 参 数 被 用 于 引导 实际 服务 参数 的 选择 。 几 种 网 络 提供 
了 服务 优先 权 ， 该 优先 权 以 某 种 方式 把 高 优先 权 流 量 看 得 比 其 他 流量 更 为 重要 。” 在 40 多 
年 前 ， 向 不 同等 级 的 流量 提供 不 同等 级 的 服务 的 设想 就 是 清晰 的 ! 然而 ， 我 们 又 花费 了 等 
长 的 时 间 去 实现 这 种 愿景 。 

1. 促进 思考 的 场景 

下 面 用 几 种 促进 思考 的 场景 来 开始 我 
们 的 提供 多 种 类 型 服务 的 网 络 机 制 的 讨论 。 

图 9-11 表示 了 一 种 简单 的 网 络 场景 ， 
两 个 应 用 分 组 流产 生 于 位 于 一 个 局 域 网 的 
主机 Hl 和 了 H2， 它 们 的 目的 地 是 另 一 个 局 
域 网 的 主机 H3 和 H4。 在 这 两 个 局 域 网 上 
的 两 台 路 由 器 通过 一 条 1. SMbps 的 链 路 连 
接 起 来 。 我 们 假设 局 域 网 的 速度 远 远 高 于 
1.5Mbps， 并 且 关 注 路 由 器 RI 的 输出 队列 ; 
注意 到 如 果 Hl 和 H2 的 总 计 发 送 速率 超过 
了 1.5Mbps， 分 组 时 延 和 丢 包 将 会 出 现 。 图 9-11 音频 应 用 与 FTP 应 用 的 竞争 
我 们 进一步 假设 1Mbps 的 音频 应 用 (例如 一 个 CD 质量 的 音频 呼叫 ) 共享 RI 和 R2 之 间 
1. 5Mbps 的 链 路 ， 同 时 从 H2 到 H4 有 一 个 HTTP Web 浏览 应 用 正在 下 载 一 个 Web 网 页 。 

在 尽力 而 为 服务 的 因特网 中 ， 该 音频 和 HTTP 分 组 在 Rl 的 输出 队列 中 混合 ， 并 且 
(通常 ) 以 先进 先 出 (FIFO) 的 次 序 传 输 。 在 这 种 情况 下 ,来 自 Web 服务 器 的 突 发 分 组 可 
能 潜在 地 填充 满 这 个 队列 ， 引 起 IP 音频 分 组 过 度 延 迟 或 者 由 于 RI 的 缓存 溢出 而 丢失 。 我 
们 应 该 如 何 解决 这 个 潜在 的 问题 呢 ? 假定 该 HTTP Web 浏览 应 用 没有 时 间 限 制 ， 我 们 的 直 
觉 也 许 是 在 RI 为 音频 分 组 分 配 严格 的 优先 级 。 在 一 个 严格 的 优先 级 调度 规则 下 ,在 Ri 
输出 缓存 的 音频 分 组 总 是 在 R1 输出 缓存 中 的 任何 HTTP 分 组 之 前 传输 。 对 音频 流量 而 言 ， 
从 R1 到 R2 的 链 路 看 起 来 像 一 条 1. SMbps 专用 链 路 ， 而 对 于 HTTP 流量 仅 当 没有 音频 流量 
排队 时 ， 才 使 用 R1 到 R2 的 链 路 。 为 了 让 RI 在 它 的 队列 中 区 分 音频 和 FTP 分组， 每 个 分 
组 必须 被 标记 为 属于 这 两 类 流量 中 的 哪 一 类 。 这 是 IPv4 中 服务 类 型 (ToS) 字段 的 最 初 目 
的 。 显 而 易 见 ， 这 则 是 我 们 对 需要 提供 多 种 类 型 流量 机 制 的 第 1 个 见解 。 









= 
vse 1.5Mbps 链 路 > 


Gz; 


SRAKAR 465 


见解 1: 标记 分 组 (packet marking) 使 得 路 由 器 区 分 属于 不 同类 型 流量 的 分 组 。 

注意 到 尽管 我 们 的 例子 考虑 到 竞争 性 的 多 媒体 和 弹性 流 ， 但 是 相同 的 见解 应 用 于 实现 了 铂 
金 卡 、 金 卡 和 银 卡 服务 类 型 的 情况 ， 即 仍 需要 标记 分 组 机 制 以 指示 分 组 属于 哪个 类 型 的 服务 。 

现在 假设 路 由 器 被 配置 为 给 标记 为 属于 1Mbps 音频 应 用 的 分 组 赋予 高 优先 级 。 因 为 输 
出 链 路 速度 是 1.5Mbps， 即 使 HTTP 分 组 得 到 较 低 的 优先 级 ， 它 们 仍然 可 以 收 到 平均 
0. 5Mbps 的 传输 服务 。 但 是 如 果 音 频 应 用 开始 以 1. SMbps 或 者 更 高 的 速率 (或 者 恶意 的 ， 
或 者 由 于 应 用 的 差错 ) 发 送 分 组 ， 那 会 出 现 什么 样 的 情况 呢 ? 在 这 种 情况 下 ，HTTP 分 组 
HIRR, EREE RI 到 R2 的 链 路 上 得 不 到 任何 服务 。 如 果 多 个 应 用 (例如 ， 多 个 音频 
呼叫 ) 都 具有 同等 的 服务 类 型 ， 共 享 一 段 链 路 带宽 ， 那么 也 会 出 现 类 似 问题 ， 即 它们 也 可 
能 共同 饿 死 该 HTTP 会 话 。 理 想 情况 下 ， 一 种 服务 要 与 各 类 流量 有 隔离 度 ， 以 保护 一 种 流 
量 类 型 免 受 其 他 流量 类 型 干扰 。 这 种 保护 能 够 在 网 络 中 的 不 同 地 方 实 现 ， 在 每 台 路 由 器 


中 ， 在 进入 网 络 的 首 个 人 口 ， 或 在 网 络 边 
界 域 间 。 这 则 是 我 们 的 第 2 个 见解 。 

见解 2: 市 望 在 流量 类 型 之 间 提 供 流量 
隔离 (traffic isolation) 的 度 ， 以 便 一 类 流 
量 不 会 受到 另 一 类 异常 流量 的 负面 影响 。 

我 们 将 考察 在 流量 类 型 之 间 提 供 这 种 
隔离 的 特定 机 制 。 这 里 我 们 注意 到 ， 有 两 
大 类 方法 可 以 使 用 。 首 先 ， 可 以 执行 如 
图 9-12 所 示 的 流量 监管 (traffic policing ) 
方法 。 如 果 流 量 类 型 或 流 必 须 满足 一 定 的 
准则 (例如 ， 音 频 流 不 超过 1Mbps 的 峰值 
速率 )， 那 么 可 以 设置 一 个 监管 机 制 来 确保 
”这 些 准则 的 确 被 遵守 。 如 果 被 监管 的 应 用 
行为 异常 ， 这 个 监管 机 制 将 采取 某 种 行动 
(例如 ， 丢 奔 或 者 延 时 那些 违反 这 些 准 则 的 
分 组 ) ， 以 便 实 际 进入 网 络 的 流量 符合 这 些 
准则 。 我 们 很 快 将 考察 的 漏 桶 机 制 也 许 是 
使 用 最 广泛 的 监管 机 制 。 在 图 9-12 中 ,分 
组 分 类 和 标记 机 制 (见解 1) 以 及 监管 机 制 
(见解 2)- 都 一 起 在 网 络 的 边缘 实现 ， 或 在 
疹 系 统 中 实现 ， 或 在 边界 路 由 器 中 实现 。 

为 流量 类 型 之 间 提 供 隔 离 的 一 种 互补 
的 方法 是 ， 链 路 级 的 分 组 调度 机 制 为 每 种 
类 型 明确 地 分 配 固定 量 的 链 路 带宽 。 例 如 ， 
在 R1 能 够 给 音频 类 型 分 配 1Mbps， 能 够 给 
HTTP 流 分 配 0. 5Mbps。 在 这 种 情况 下 ， 音 
PAA HTTP 流 分 别 看 到 了 容量 为 1. OMbps 和 
0. 5Mbps 的 逻辑 链 路 ， 如 图 9-13 所 示 。 通 
过 严格 执行 链 路 级 的 带宽 分 配 ， 一 种 类 型 








|| 标记 


图 9-12 监管 (与 标记 ) 音频 与 HTTP 流量 类 型 


S31.0Mbps 逻 辑 链 路 
>. 1.5Mbps 链 路 图 一 R2 


H4 
图 9-13 音频 与 HTTP 流量 类 型 的 逻辑 隅 离 
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仅 能 够 使 用 已 经 分 配 的 带宽 量 ; 特别 是 ， 它 不 能 利用 其 他 应 用 现在 未 使 用 的 带宽 。 例 如 ， 
如 果 音 频 流 静默 了 〈 例 如， 如 果 谈 话 者 停顿 ， 不 产生 音频 分 组 ) HTTP 流 在 R1 到 R2 的 
链 路 上 的 传输 带宽 仍然 不 能 够 超过 0. 5Mbps， 即 使 音频 流 分 配 的 | Mbps 带宽 在 那个 瞬间 没 
有 使 用 。 由 于 带宽 是 一 种 “使 用 它 或 丢失 它 〈use-it- or-lose-it) ”的 资源 ， 没 有 理由 妨碍 
HTTP 流量 使 用 没有 由 音频 流 使 用 的 带宽 。 我 们 将 希望 尽 可 能 高 效 地 使 用 带宽 ， 当 能 够 以 
别 的 方法 使 用 它 时 决 不 浪费 带宽 。 这 引发 我 们 的 第 3 个 见解 。 

见解 3: 当 为 流量 类 型 或 流 之 间 提 供 隔 离 时 ,希望 尽 可 能 有 效 地 使 用 资源 (例如 链 路 
带宽 和 缓存 )。 

2. 调度 机 制 


在 1.3 节 和 4.2 节 我 们 曾经 讨论 过 ， 属 于 各 种 网 络 流 的 分 组 被 复 用 在 一 起 ， 并 且 在 与 
链 路 关联 的 输出 缓存 排队 等 竺 传输 。 选 择 在 链 路 上 传输 的 排队 分 组 的 方式 称 为 链 路 调度 规 
则 (link-scheduling discipline) ， 并 在 4.2 节 进 行 了 详细 讨论 。 回 想 在 4.2 节 中 讨论 过 三 种 
链 路 调度 规则 ， 即 FIFO 、 优 先 权 排队 和 加 权 公 平 队列 〈WFQ) 。 我 们 马上 将 看 到 WFO 对 
于 格力 流量 类 型 将 起 到 特别 重要 的 作用 。 
3. 监管 : dah 
我 们 前 面 的 见解 之 一 是 监管 ， 速 率 的 调节 是 一 种 重要 的 QoS 机 制 ， 以 该 速率 允许 一 类 
流量 或 流 (在 下 面 的 讨论 中 ， 我们 将 假定 监管 的 单位 是 流 ) 回 网 络 注入 分 组 。 但 是 应 该 对 
一 个 流 的 分 组 速率 的 哪些 方面 进行 监管 呢 ? 我 们 能 够 指出 3 个 重要 的 监管 准则 ， 每 个 准则 
根据 被 监管 分 组 流 的 时 间 范 围 而 互 不 相同 : 
© 平均 速率 。 网 络 可 能 和 布 望 限 制 一 个 流 的 分 组 能 够 发 送 到 网 络 中 的 长 期 平均 速率 
(每 个 时 间 间 隔 的 分 组 数 ) 。 这 里 一 个 关键 的 问题 是 监管 平均 速率 的 时 间 间 隔 。 一 
个 平均 速率 被 限制 为 每 秒 100 个 分 组 的 流 要 比 一 个 每 分 钟 6000 个 分 组 的 源 受到 的 
约束 更 严格 ， 即 使 在 一 个 足够 长 的 时 间 间 隔 上 它们 有 相同 的 平均 速率 。 例 如 ， 后 
者 的 限制 允许 一 个 流 在 给 定 1 秒 长 的 时 间 间 隔 内 发 送 1000 个 分 组 ， 而 前 者 的 限制 
不 允许 这 种 发 送行 为 。 
© 峰值 速率 。 平 均 速 率 约 束 限 制 了 一 个 相对 长 的 时 间 内 能 够 发 送 到 网 络 中 的 流量 ， 
而 峰值 约束 限制 了 一 个 较 短 时 间 内 能 够 发 送 的 最 大 分 组 数 。 使 用 我 们 上 面 的 例子 ， 
网 络 能 以 每 分 钟 6000 个 分 组 的 平均 速率 来 监管 一 个 流 ， 但 是 限制 该 流 的 峰值 速率 
为 每 秒 1500 个 分 组 。 
© 突 发 长 度 。 网 络 也 许 还 和 希望 限制 极 短 的 时 间 间 隔 内 能 够 发 送 到 网 络 中 的 最 大 分 组 
数 (分 组 的 “ 突 发 (burst)”)。 在 这 个 限制 中 ， 因 为 时 间 间 隔 长 度 趋 近 于 0， 该 突 
发 长 度 限制 了 能 够 瞬间 发 送 到 网 络 中 的 分 组 数量 。 尽 管 瞬间 发 送 多 个 分 组 到 网 络 
中 在 物理 上 是 不 可 能 的 (毕竟 每 条 链 路 都 有 一 个 无 法 超越 的 物理 传输 速率 !)， 但 
对 最 大 突 发 长 度 的 抽象 也 是 有 用 的 。 
漏 桶 机 制 是 一 个 能 够 用 来 表征 这 些 监 管 限制 的 抽象 。 如 图 9- 14 所 示 ， 漏 桶 由 一 个 能 
够 容纳 5 个 令 牌 的 桶 组 成 。 令 牌 加 进 该 桶 的 过 程 如 下 。 可 能 潜在 地 加 入 桶 中 的 新 令 牌 总 是 
以 每 秒 r 个 令 牌 的 速率 产生 。( 为 了 简单 化 起 见 ， 我 们 这 里 假设 时 间 单 元 是 秒 。) 当 产 生 一 
个 令 牌 时 ， 如 果 桶 填充 得 少 于 。 个 令 牌 ， 新 产生 的 令 牌 加 入 到 该 桶 中 ; 否则 忽略 该 新 产生 
的 令 牌 ， 令 牌 桶 保持 具有 “个 令 牌 的 满 状 态 。 
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图 9-14 漏 桶 监管 器 


现在 我 们 考虑 如 何 用 漏 桶 来 监管 分 组 流 。 假 设 在 一 个 分 组 向 网 络 传输 之 前 ， 必 须 首 先 
从 令 牌 桶 中 去 除 一 个 令 牌 。 如 果 令 牌 桶 是 空 的 ， 分 组 必须 等 待 一 个 令 牌 。 ( 另 一 种 方法 是 
丢弃 该 分 组 ， 尽 管 我 们 这 里 不 讨论 这 种 选择 。) 现在 我 们 考虑 这 种 行为 是 如 何 监管 一 个 流 
量 流 的 。 因 为 在 桶 中 最 多 能 有 个 邻 牌 ， 所 以 漏 桶 监管 的 流 的 最 大 突 发 长 度 是 ， 个 分 组 。 
此 外 ， 因 为 令 牌 产生 速率 是 r+-， 所 以 在 任何 长 度 为 t 的 时 间 间 隔 内 能 够 进入 网 络 中 的 最 大 
分 组 数目 为 rt+b。 因 此 , 令 牌 产生 速率 r 用 于 限制 分 组 能 够 进入 网 络 的 长 期 平均 速率 。 除 
了 监管 长 期 平均 速率 之 外 ， 使 用 漏 桶 (具体 来 说 ， 串 联 的 两 个 漏 桶 ) 来 监管 流 的 峰值 速率 
也 是 有 可 能 的 ; 见 本 章 末 的 习题 。 

4. 漏 桶 + 加权 公平 排队 = 队列 中 可 证 明 的 最 大 时 延 

我 们 关于 策略 的 最 后 讨论 是 说 明 如 何 将 调度 和 监管 两 种 机 制 结 合 起 来 ， 以 提供 通过 路 
由 器 队列 的 时 延 界限 (鼓励 已 经 忘记 
WFQ 的 读者 复习 一 下 4.2 节 )。 我 们 考 
虑 一 台 使 用 了 WFQ 调度 的 路 由 器 ， 它 
的 输出 链 路 多 路 复 用 了 n 条 流 ， 其 中 每 
条 流 被 一 个 参数 为 b, Mr, 的 漏 桶 监管 ， 
i=1,，…,，n。 这 里 我 们 使 用 的 术语 
“ 流 ” 大 致 是 指 不 能 被 调度 希 相 互 区 别 
的 分 组 集合 。 实 践 中 ， 一 条 流 可 能 是 由 
单个 端 到 端 连接 上 的 流量 或 者 许多 这 种 
连接 的 集合 流量 组 成 的 ， 参 见 图 9-15 。 

我 们 前 面 讨 论 WFQ 时 讲 过 ， 每 个 
流 i 保 证 收 到 至 少 等 于 RR:' w,/( Dw) 的 共享 链 路 带宽 ， 其 中 R 是 以 分 组 / 秒 为 单位 的 链 路 
传输 速率 。 当 以 WFQ 方式 等 竺 服务 时 (也 就 是 通过 漏 桶 传递 之 后 ) ， 则 分 组 经 受 的 最 大 时 
延 是 什么 ? 我们 来 关注 流 1。 假 设 流 1 的 令 牌 桶 最 初 是 满 的 。 然 后 b 个 分 组 的 突 发 到 达 流 
1 的 漏 桶 监管 器 。 这 些 分 组 去 除了 漏 桶 中 所 有 的 令 牌 (没有 等 待 ) ， 然 后 加 入 了 流 1 的 
WFQ 等 竺 区域。 因为 这 b, 个 分 组 以 至 少 Rw/( Ew) 分 组 / 秒 的 速度 得 到 服务 ， 直 到 这 
些 分 组 的 最 后 一 个 传输 完成 ， 所 以 将 有 最 大 时 延 d,,, ， 其 中 

i 
Rese 





图 9-15 KH WFQ 调度 机 制 的 n 路 复 用 的 漏 桶 流 
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该 公式 的 基本 原理 是 ， 如 有 果 在 队列 中 有 bi 个 分 组 并 且 分 组 以 至 少 每 秒 尺 .zi (之 她 ) 
个 分 组 的 速率 从 队列 中 接受 服务 〈 被 去 除 ) ， 那 么 直到 最 后 一 个 分 组 的 最 后 一 个 比特 被 传送 ， 
时 间 量 不 会 超过 b,A(R: wi/( wj))。 一道 课 后 习题 请 你 证 明 ， 只 要 7 <R: wi/( Zw;)， 则 
dw 确实 是 流 1 中 任何 分 组 在 WFQ 队列 中 要 经 受 的 最 大 时 延 。 


9. 5.3 区 分 服务 


在 学 习 了 提供 多 种 类 型 服务 的 动机 、 见 解 和 特定 的 机 制 后 ， 我 们 将 注意 力 集 中 于 以 举 
例 方式 学 习 提 供 多 种 类 型 服务 的 方法 ， 即 因特网 区 分 服务 (Diffserv) 体系 结构 [RFC 
2475; Kilkki 1999 |] Diffserv 提供 服务 区 分 ， 也 就 是 在 因特网 中 以 一 种 可 扩展 性 方式 用 不 
同 的 方法 处 理 不 同类 型 流量 的 能 力 。 可 扩展 性 的 需求 来 源 于 这 样 的 事实 : 在 因特网 的 一 个 
主干 路 由 器 上 同时 存在 几 十 万 个 源 到 目的 地 的 并 行 流 。 我 们 很 快 将 看 到 ， 仅 仅 通过 在 网 络 
核心 放置 简单 的 功能 ， 而 在 网 络 的 “边缘 ”实现 更 复杂 的 控制 操作 ， 就 可 以 满足 该 需要 。 
我 们 从 图 9-16 中 显示 的 简单 网 络 开 始 讨论 。 这 里 我 们 将 描述 Diffserv 的 一 种 可 能 用 
法 。 如 RFC 2475 中 所 描述 ， 其 他 的 变化 是 可 能 的 。 区 分 服务 体系 结构 由 两 个 功能 元 素 的 
集合 所 组 成 : 
© 边界 功能 : 分 组 分 类 和 流量 调节 。 在 网 络 的 人 边缘 (也 就 是 , 或 者 在 产生 流量 的 - 
Diffserv 使 能 的 主机 ， 或 者 在 流量 经 过 的 第 一 个 Diffserv 使 能 的 路 由 器 ) ， 到 达 的 分 组 
被 标记 。 更 具体 地 说 ， 在 IPv4 或 者 IPv6 分 组 首部 中 的 区 分 服务 (DS) 字段 被 设置 
为 某 个 值 [RFC 3260], 1% DS 字段 的 定义 意欲 取代 我 们 在 第 4 章 中 讨论 的 IPv4 服务 
类 型 字段 和 IPv6 流量 类 型 字段 。 例 如 ， 在 图 9-16 H, AH 发 送 到 H3 的 分 组 可 能 
在 RI 被 标记 ， 而 从 H2 发 送 到 H4 的 分 组 可 能 在 R2 被 标记 。 分 组 得 到 的 标记 标识 了 
该 分 组 所 属 的 流量 类 型 。 然 后 不 同类 型 的 流量 将 在 核心 网 络 得 到 不 同 的 服务 。 


HI 


E E 





图 例 : 
CD ryha CD 核心 路 由 器 
图 9-16 一 个 简单 的 Diffserv 网 络 例 子 


© 核心 功能 : 转发 。 当 一 个 DS 标记 的 分 组 到 达 一 个 Diffserv 使 能 的 路 由 器 时 ， 根 据 
与 分 组 类 型 相关 的 所 谓 的 每 跳 行为 (Per-Hop Behavior，PHB ) ， 该 分 组 被 转发 到 它 
的 下 一 跳 。 每 跳 行为 影响 在 竞争 的 流量 类 型 之 间 共 享 路 由 器 缓存 和 链 路 带宽 的 方 
Io Diffserv 体系 结构 的 一 个 关键 原则 是 路 由 器 的 每 跳 行 为 只 基于 分 组 标记 ， 即 分 
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组 所 属 的 流量 类 型 。 因 此 ， 如 果 图 9-16 中 从 Hl 发 送 到 H3 的 分 组 和 从 H2 发 送 到 
H4 的 分 组 收 到 同样 的 标记 ， 网 络 路 由 器 则 将 这 些 分 组 处 理 为 一 个 聚合 体 ， 而 不 区 
别 这 些 分 组 是 源 于 Hl 还 是 源 于 H2。 例 如 ， 当 这 些 分 组 向 R4 转发 时 ，R3 不 区 分 
从 HI 和 H2 产生 的 分 组 。 因 此 ，Diffserv 体系 结构 消除 了 为 各 个 “ 源 到 目的 地 ” 
对 而 保留 路 由 器 状态 的 要 求 ， 这 是 使 Diffserv 具有 可 扩展 性 的 一 个 重要 考虑 。 

这 里 有 一 个 类 比 可 能 有 助 于 理解 相关 概念 。 在 很 多 大 规模 的 社交 活动 中 〈 例 如 ， 一 场 大 
型 的 公众 招待 会 ， 一 场 大 型 的 跳舞 俱乐部 活动 或 者 迪斯科 舞会 ， 一 场 音 乐 会 或 者 一 场 足球 
赛 ) ， 参 加 活动 的 人 收 到 某 种 类 型 的 人 场 券 。 对 于 非常 重要 的 人 物 有 VIP 人 场 券 ; 对 于 21 岁 
或 者 年 龄 更 大 的 人 有 21 岁 以 上 的 人 场 券 (例如 是 否 可 以 享受 酒 类 饮料 ); 对 于 演唱 人 员 有 后 
台 人 场 券 ; 对 于 记者 有 新 闻 入 场 券 ， 对 于 普通 人 有 普通 的 人 场 券 。 这 些 人 场 券 通 常 在 该 活动 
的 入口 分 发 ， 也 就 是 在 活动 的 边缘 进行 分 发 。 正 是 在 边缘 ， 进 行 着 计算 密集 型 操作 ， 例 如 交 
人 场 费 、 检 查 适 合 的 邀请 类 型 以 及 对 照 检查 邀请 与 证 件 。 此 外 ， 对 于 允许 进入 一 个 活动 的 特 
定 类 型 的 人 数 可 能 有 限制 。 如 果 有 这 种 限制 ， 人 们 可 能 在 进入 活动 之 前 必须 等 待 。 一 旦 进入 
了 了 活动， 一 个 人 的 入 场 券 使 他 在 活动 中 的 很 多 场所 接受 有 区 别 的 服务 ， 如 为 VIP 提供 免费 的 
饮料 、 较 好 的 桌子 、 免 费 食 物 、 单 独 的 房间 和 和 扎 勤 的 服务 。 与 之 相对 照 的 是 ， 一 个 普通 人 禁 
止 进入 某 些 区 域 ， 要 为 饮料 支付 费用 ， 并 且 只 受到 基本 服务 。 在 这 两 种 情况 下 ， 活 动 中 得 到 
的 服务 只 依赖 于 人 场 券 的 类 型 。 而 且 在 同一 类 型 的 所 有 人 得 到 相同 的 对 待 。 

图 9-17 提供 了 在 边缘 路 由 器 中 分 类 和 标记 功能 的 逻辑 视图 。 到 达 边 缘 路 由 器 的 分 组 
首先 被 分 类 。 分 类 器 根据 一 个 或 多 个 分 组 首部 字段 的 值 (例如 源 地 址 、 目 的 地 址 、 源 端 
口 、 目 的 端口 和 协议 ID) 来 选择 分 组 ， 并 引导 该 分 组 去 做 合适 的 标记 功能 。 如 前 面 所 指 
出 的 ， 分 组 的 标记 携带 在 分 组 首部 的 DS 字段 中 。 

在 某 些 情况 下 ， 端 用 户 可 能 已 经 同意 限制 其 分 组 发 送 速率 以 符合 某 个 申报 的 流量 配置 文 
件 (traffic profile) 。 该 流量 配置 文件 可 能 包含 对 峰值 速率 和 分 组 流 的 突 发 度 的 限制 ， 如 我 们 
前 面 在 漏 桶 机 制 中 所 见 。 只 要 用 户 以 符合 协商 的 流量 配置 文件 的 方式 向 网 络 中 发 送 分 组 ， 这 
些 分 组 就 会 得 到 它们 的 优先 级 标记 ， 并 沿 着 到 目的 地 的 路 径 转发 。 另 一 方面 ， 如 果 违 反 了 该 
流量 配置 文件 ， 那 些 超出 流量 配置 文件 的 分 组 就 可 能 被 打上 不 同 的 标记 ， 或 被 整形 〈 例 如 ， 
为 了 能 够 遵守 最 大 速率 限制 而 延 时 ) , Oo 
或 可 能 在 网 络 边缘 被 丢弃 。 图 9- 17 中 测定 器 
所 示 的 测定 功能 (metering function ) 
的 作用 是 比较 进入 的 分 组 流 和 协商 的 
流量 配置 文件 ， 并 确定 某 分 组 是 否 在 
协商 的 流量 配置 文件 之 内 。 有 关 是 否 
立即 重新 标记 、 转 发 、 延 时 或 者 丢弃 
一 个 分 组 的 实际 决定 是 由 网 络 管理 员 
决定 的 策略 问题 ， 而 不 是 由 Diffserv 体 图 9-17 在 端 路 由 器 上 的 分 组 分 类 与 流量 调节 的 逻辑 视图 
系 结构 规定 的 。 

到 现在 为 止 ， 我 们 一 直 关 注 着 Diffserv 体系 结构 中 的 标记 和 监管 功能 。Diffserv 体系 结 
构 的 第 二 个 关键 组 件 涉及 由 Diffserv 使 能 路 由 器 所 执行 的 每 跳 行 为 (PHB ) 。 该 每 跳 行 为 有 
点 神秘 ， 但 被 仔细 地 定义 为 “Diffserv 节点 的 外 部 可 观察 的 转发 行为 的 描述 ， 该 节点 应 用 
了 一 个 特定 的 Diffserv TARA” [RFC 2475 ] 。 稍 微 深入 地 钻研 一 下 这 个 定义 ,我 们 可 以 
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看 到 它 里 面包 含 的 几 个 重要 的 考虑 : 
e PHB 能 够 导致 不 同 服务 类 型 的 流量 接收 到 不 同性 能 〈 即 不 同 的 外 部 可 观察 的 转发 
行为 ) © 
e 虽然 PHB 定义 了 在 各 种 类 型 之 间 的 性 能 (行为) 差别 ， 但 它 不 强求 为 了 获得 这 些 
行为 的 任何 特定 机 制 。 只 要 外 部 可 观察 的 性 能 准则 得 到 满足 ， 任 何 实现 机 制 和 任 
何 缓存 /带宽 分 配 策略 都 可 以 使 用 。 例 如 ， 一 个 PHB 将 不 要 求 使 用 一 个 特定 的 分 
组 排队 规则 (例如 优先 级 队列 、WFQ 队列 或 FCFS 队列 ) 以 取得 特定 的 行为 。 
PHB 是 最 后 的 结果 ， 资 源 分 配 和 实现 机 制 是 达到 PHB 的 手段 。 
o 性 能 的 差别 必须 是 可 观察 的 ， 因 而 是 可 测量 的 。 
已 经 定义 了 两 种 PHB: 一 种 是 加 速 转发 PHB [RFC 3246 ] ， 为 一 种 是 确保 转发 PHB 
[ RFC 2597 ] 。 加 速 转 发 (Expedited Forwarding, EF) PHB 规定 了 一 类 流量 离开 路 由 需 的 
速率 必须 等 于 或 者 大 于 某 个 已 配置 的 速率 。 确 保 转发 (Assured Forwarding, AF) PHB 将 
流量 分 为 4 类 ， 其 中 每 个 AF 类 都 确保 提供 某 种 最 小 数量 的 带宽 和 缓存 。 
我 们 通过 对 Diffserv 的 服务 模型 进行 一 些 观察 来 结束 对 Diffserv 的 讨论 。 首 先 ， 我 们 隐 
含 地 假设 Diffserv 部 署 在 单个 管理 域 中 ， 但 典型 情况 是 端 到 端的 服务 必须 在 跨越 通信 端 系 
统 之 间 的 多 个 ISP 来 形成 。 为 了 提供 端 到 端的 Diffserv 服务 ， 端 系统 之 间 的 所 有 ISP 不 仅 必 - 
须 提 供 这 种 服务 ， 而 且 为 了 向 端 用 户 提供 真正 的 端 到 端 服务 ， 多 数 ISP 之 间 也 要 协作 并 做 
出 安排 。 如 果 没 有 这 种 协作 ， 直 接 向 客户 出 售 Diffserv 的 ISP 会 发 现 他 们 将 重复 地 说 :“ 是 
的 ， 我 们 知道 你 文 付 了 额外 费用 ,但 是 我 们 与 丢弃 和 延迟 你 流量 的 ISP 之 间 没 有 服务 约 
定 。 我 很 抱歉 在 你 的 VoIP 电话 中 有 很 多 间 际 !” 第 二 ， 如 果 Diffserv 实际 存在 并 且 该 网 络 
运行 的 负载 不 大 ， 大 多 数 时 间 尽 力 而 为 服务 和 Diffserv 服务 之 间 将 没有 可 觉察 的 差异 。 的 
确 ， 端 到 端 时 延 通 常 是 由 接 人 速率 和 路 由 器 跳 数 造成 的 ， 而 不 是 由 路 由 器 中 的 排队 时 延 造 
成 的 。 想 象 一 个 支付 了 增值 服务 费用 的 不 幸 的 Diffserv 客户 ， 发 现 为 其 他 人 提供 的 尽力 而 
为 服务 几乎 总 是 具有 与 增值 服务 相同 的 性 能 ! 


9. 5.4 每 连接 服务 质量 保证 : 资源 预约 和 呼叫 准 入 


在 前 一 节 中 ， 我 们 已 经 看 到 了 分 组 标记 和 监管 、 流 量 隅 离 以 及 链 路 级 调度 能 够 为 一 类 
服务 提供 比 另 一 类 更 好 的 性 能 。 在 某 些 调度 规则 下 ， 如 优先 权 调 度 ， 较 低 类 型 的 流量 基本 
对 最 高 优先 权 类 型 的 流量 是 “不 可 见 ” 的 。 借 助 于 适当 的 网 络 定制 ， 最 高 类 型 的 服务 的 确 
能 够 取得 极 低 的 丢 包 和 时 延 ， 即 基本 上 是 
类 似 于 电路 的 性 能 。 但 是 ， 这 种 网 络 能 够 
确保 一 个 在 高 优先 权 流 量 类 型 中 的 进行 
流 ， 仅 使 用 我 们 已 经 描述 的 这 些 机 制 就 能 
在 整个 流 期 间 持续 得 到 这 样 的 服务 吗 ? 答 
案 是 否定 的 。 在 本 节 中 ， 我 们 将 看 到 当 对 
各 个 连接 提供 便服 务 保证 时 ， 为 什么 还 需 
要 另外 的 网 络 机 制 和 协议 。 

我 们 返回 9. 5. 2 节 的 场景 中 ， 考 虑 两 | 3 
个 1Mbps 的 音频 应 用 经 1. 5Mbps Hp H H4 
传输 它们 的 分 组 ， 如 图 9-18 所 示 。 这 两 ”图 9-18 两 个 竞争 的 音频 应 用 过 载 R1 到 R2 的 链 路 
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条 流 的 结合 数据 率 (2Mbps) 超过 了 这 条 链 路 的 容量 。 即 使 使 用 分 类 和 标记 、 流 量 隔 离 以 

及 共享 未 使 用 的 带宽 (这 里 并 没有 未 使 用 的 带宽 ) ， 这 很 明显 还 是 一 个 与 丢 包 有 关 的 命题 。 

只 是 因为 没有 足够 的 带宽 同时 满足 两 个 应 用 的 需求 。 如 果 这 两 个 应 用 平等 地 共享 该 带宽 ， 

每 个 应 用 将 会 丢失 其 25% 的 传输 分 组 。 这 是 一 个 无 法 接受 的 低 QoS， 以 至 于 两 个 音频 应 用 

完全 不 可 用 ; 甚至 从 一 开始 就 没有 必要 传输 任何 音频 分 组 。 

在 图 9-18 中 两 个 应 用 不 能 同时 满足 的 情况 下 ， 这 个 网 络 应 当做 些 什 么 呢 ? 如 果 人 允许 

两 者 以 一 种 不 可 用 的 QoS 继续 在 应 用 流 上 浪费 网 络 资源 ， 最 终 将 无 法 向 端 用 户 提 供 任 何 效 

用 。 和 希望 该 答案 是 清晰 的 ， 即 应 用 流 中 的 一 个 应 当 被 阻塞 ( 即 拒绝 接 人 网 络 ) ， 而 另 一 个 

应 当 人 允许 继续 进行 ， 使 该 应 用 使 用 所 需 的 全 部 1Mbps。 电 话 网 是 一 个 执行 这 种 呼叫 阻塞 的 

网 络 例子 ， 即 如 果 要 求 的 资源 〈 在 电话 网 的 情况 下 是 一 个 端 到 端的 电路 ) 不 能 分 配给 该 呼 

叫 ， 该 呼叫 就 被 阻塞 了 (阻止 进入 网 络 ) ， 并 且 返 回 给 用 户 一 个 忙 信 号 。 在 我 们 的 例子 中 ， 

如 果 一 个 流 没 有 分 配 到 足够 的 QoS 来 使 自己 可 用 ， 人 允许 它 进 入 网 络 没 有 任何 好 处 。 的 确 ， 

接纳 一 个 不 能 得 到 它 需 要 的 QoS 的 流 是 要 付出 代价 的 ， 因 为 网 络 资源 被 用 于 支持 一 个 对 端 

用 户 没 有 用 的 流 。 
通过 基于 流 的 资源 要 求 以 及 已 经 准 入 流 的 资源 要 求 明 确 地 准 和 人 或 阻塞 流 ， 网 络 能 够 保 

证 准 入 流 可 得 到 它们 所 请 求 的 QoS。 这 隐 含 的 意思 是 : 需要 为 流 提供 有 保证 的 QoS 就 需要 

流 来 申告 它 的 QoS 需求 。 让 流 申告 它 的 QoS 需求 ， 然 后 让 网 络 接受 该 流 (以 所 要 求 的 

QoS) 或 者 阻塞 该 流 的 过 程 称 为 呼叫 准 入 (call admission) 过 程 。 这 则 是 我 们 的 第 4 TH 

解 〈 除 了 前 面 9. 5. 2 节 中 的 3 个 见解 外 ) ， 该 见解 增加 了 提供 QoS 所 需 的 机 制 。 
见解 4: 如 果 不 总 是 能 够 提供 充分 的 资源 ， 并 且 要 确保 QoS， 则 需要 一 个 呼叫 准 入 过 

程 ， 在 这 个 过 程 中 流 申 告 其 QoS 需求 ， 然 后 要 么 被 网 络 准 入 (以 所 要 求 的 QoS)， 要 么 被 

网 络 阻 塞 (如 果 网 络 不 能 提供 所 要 求 的 QoS), 

如 果 一 个 呼叫 (一 个 端 到 端 流 ) 一 旦 开始 就 要 被 确保 给 定 的 服务 质量 ， 则 我 们 在 
图 9-18 中 的 促进 思考 的 例子 强调 了 对 几 种 新 的 网 络 机 制 和 协议 的 需求 : 

© 资源 预 留 。 为 了 满足 一 个 呼叫 所 希望 的 Qo5， 确 保 它 具有 所 需 的 资源 ( 链 路 带宽 、 
缓存 ) 的 唯一 方法 是 显 式 地 为 该 呼叫 分 配 这 些 资源 ， 用 网 络 的 行 话 来 讲 ， 该 过 程 
称 为 资源 预 留 (resource reservation ) 。 一 旦 呼叫 预约 了 资源 ， 它 在 其 整个 过 程 中 按 
需 访问 这 些 资 源 ， 而 不 管 所 有 其 他 呼叫 的 需求 。 如 果 一 个 呼叫 预约 并 得 到 链 路 带 
宽 的 xMbps 的 保证 ， 而 且 传 输 速 率 决 不 会 大 于 x Mbps， 则 该 呼叫 将 具有 无 丢 包 和 
无 时 延 的 性 能 。 

e 呼叫 准 入 。 如 果 预 留 了 资源 ， 则 该 网 络 必须 具有 一 种 用 于 呼叫 请 求 和 预 留 资源 的 
机 制 。 由 于 资源 不 是 无 限 的 ， 如 果 请 求 的 资源 不 可 用 ， 则 进行 呼叫 准 入 请 求 的 呼 
叫 将 被 拒绝 准 入 ， 即 被 阻塞 。 电 话 网 执行 的 是 这 种 呼叫 准 人 机 制 ， 即 当 我 们 拨 一 
个 号 码 时 ， 就 请 求 了 资源 。 如 果 完 成 该 呼叫 所 需 的 电路 (TDMA AY BR) 是 可 用 的 ， 
则 分 配 电路 并 且 完 成 了 呼叫 。 如 果 电 路 不 可 用 ， 则 该 呼叫 被 阻塞 ， 我 们 得 到 了 忙 
信和 号。 为 了 得 到 网 络 的 准 入 ， 被 阻塞 的 呼叫 能 够 一 再 尝试 ， 但 是 直到 它 成 功 地 完 
成 呼叫 准 人 人 过程， 才 被 允许 向 网 络 发 送 流 量 。 当 然 ， 分 配 链 路 带宽 的 路 由 器 ， 其 
分 配 的 带宽 不 应 当 超 过 链 路 可 用 的 带宽 。 通 常 ， 一 个 呼叫 仅 能 预约 一 条 链 路 的 带 
宽 的 一 部 分 ， 因 此 一 台 路 由 器 可 以 为 多 于 一 条 呼叫 分 配 链 路 带宽 。 然 而 ， 如 果 要 
提供 硬 服务 质量 保证 的 话 ， 为 所 有 呼叫 分 配 的 带宽 总 和 应 当 小 于 该 链 路 的 容量 。 

e 呼叫 建立 信 令 。 以 上 描述 的 呼叫 准 人 过程 要 求 一 条 呼叫 沿 着 它 的 源 到 目的 地 路 径 
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在 每 台 网 络 路 由 器 中 能 够 预约 充足 的 资源 ， 以 确保 满足 它 的 端 到 端 QoS 请 求 。 每 
台 路 由 器 必须 决定 会 话 所 请 求 的 本 地 资源 ， 考 虑 已 经 承诺 给 其 他 进行 中 的 会 话 的 
资源 量 ， 并 决定 它 是 否 有 足够 的 资源 来 满足 在 这 人 台 路 由 器 上 的 该 会 话 的 每 跳 QoS 
要 求 ， 而 不 违反 对 所 有 已 经 准 入 的 会 话 做 出 的 本 地 QoS 保证 。 需 要 一 个 信 令 协议 
来 协调 这 些 各 种 各 样 的 活动 ， 即 本 地 资源 的 每 跳 分 配 ， 以 及 该 呼叫 是 否 能 够 在 沿 
着 端 到 端 路 径 上 的 每 台 路 由 器 中 预约 充分 的 资源 。 这 是 如 图 9-19 所 示 的 呼叫 建立 
协议 (call setup protocol) 的 任务 。 资 源 预 留 协议 (resource ReSerVation Protocol, 
RSVP) [Zhang 1993, RFC 2210] 就 是 在 因特网 体系 结构 中 为 此 目的 所 提出 的 ， 
用 于 提供 服务 质量 保证 。 在 ATM 网 络 中 ，Q2931b 协议 [ Black 1995] 在 ATM 网 
络 的 交换 机 和 端点 之 间 承 载 了 这 种 信息 。 

QoS 呼叫 信 令 建立 





图 9-19 呼叫 建立 过 程 


尽管 投入 了 巨大 的 研究 和 开发 力量 ， 并 且 甚 至 开发 出 了 提供 每 连接 服务 质量 保证 的 产 
品 ， 但 是 几乎 没有 这 种 服务 的 扩展 部 署 。 有 许多 可 能 的 原因 。 首 当 其 冲 的 是 ， 情 况 很 可 能 
是 我 们 在 9. 2 ~ 9. 4 节 学 习 的 简单 的 应 用 级 机 制 与 适当 的 网 络 定制 相 结合 (9. 5. 1 节 )， 为 
多 媒体 应 用 提供 了 “足够 好 的 ”尽力 而 为 的 网 络 服务 。 此 外 ，ISP 判断 : 提供 每 连接 服务 
质量 保证 所 需 的 附加 复杂 性 以 及 部 署 和 管理 网 络 的 成 本 ， 相 对 于 该 服务 可 预测 的 用 户 收 
入 ， 前 者 可 能 过 高 。 


9.6 人 小结 


多 媒体 网 络 是 当今 因特网 中 最 为 激动 人 心 的 发 展 之 一 。 全 世界 的 人 们 在 收音 机 和 电视 
机 面前 花费 的 时 间 越 来 越 少 ， 而 转向 使 用 他 们 的 智能 手机 和 设备 接收 音频 和 视频 传输 ， 它 
们 包含 了 实况 转播 和 预先 录制 的 节目 。 此 外 ， 借 助 于 如 YouTube 这 样 的 网 站 ， 用 户 除 了 是 
多 媒体 因特网 内 容 的 消费 者 ， 也 成 为 内 容 的 生产 者 。 除 了 视频 分 发 ， 因 特 网 也 正在 用 于 传 
输电 话 。 事 实 上 ， 经 过 下 一 个 10 年 ， 因 特 网 连同 无 线 因特网 接 入 ， 可 能 致使 传统 的 电路 
交换 电话 系统 成 为 明日 黄花 。VolP 不 仅 提 供 了 廉价 的 电话 服务 ， 而 且 将 提供 大 量 的 增值 
服务 ， 例 如 视频 会 议 、 在 线 目录 服务 、 语 音 消息 及 融 人 如 脸 书 和 微 信 等 社交 网 络 。 

在 9.1 节 中 ,我 们 描述 了 视频 和 语音 的 内 在 特点 ， 将 多 媒体 应 用 分 为 3 种 类 型 : 
(i) 流 式 存 储 音频 /视频 ; (ii) 会 话 式 P 语音/ 视频 ; (Gii) 流 式 实况 音频 /视频 。 
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在 9. 2 799, 我们 更 为 深入 地 学 习 了 流 式 存 储 视频 。 对 于 流 式 视频 应 用 ， 预 先 录 制 的 
视频 放置 在 服务 器 上 ， 用 户 向 这 些 服务 顺 发 送 请 求 以 按 需 观 看 这 些 视 频 。 我 们 看 到 流 式 视 
频 系 统 能 够 被 分 为 两 种 类 型 : UDP 流 和 HTTP 流 。 我 们 观察 到 对 于 流 式 视频 的 最 为 重要 的 
性 能 测量 是 平均 砧 吐 量 。 

在 9.3 节 中 ， 我们 研究 了 诸如 VoIP 等 会 话 式 多 媒体 应 用 能 够 设计 运行 在 尽力 而 为 网 
络 上 的 方法 。 对 于 会 话 式 多 媒体 ， 定 时 考虑 是 重要 的 ， 因 为 会 话 式 应 用 是 高 度 时 延 敏感 
的 。 在 另 一 方面 ， 会 话 式 多 媒体 应 用 是 容忍 丢 包 的 ， 即 偶尔 的 丢 包 仅 会 在 音频 /视频 播放 
中 引起 偶尔 的 干扰 信号 ， 并 且 这 些 丢 包 常 常 能 被 部 分 地 或 者 全 部 地 掩盖 。 我 们 看 到 将 客户 
缓存 、 分 组 序号 和 时 间 戳 结合 起 来 的 方法 ， 极 大 地 缓解 了 网 络 引 入 的 时 延 抖 动 的 影响 。 我 
们 也 展望 了 Skype 所 依赖 的 技术 ，Skype Æ IP ER M P 视频 界 的 领头 公司 之 一 。 在 9.4 节 
中 ， 我 们 学 习 了 两 种 最 为 重要 的 用 于 VolP 的 标准 化 协议 ， 即 RTP 和 SIP. 

在 9.5 节 中 ,我 们 介绍 了 几 种 网 络 机 制 〈 链 路 级 调度 规则 和 流量 监管 ) 是 如 何 用 于 在 
几 类 流量 之 间 提 供 区 分 服务 的 。 


课 后 习题 和 问题 





9.1 节 

R1. 针对 Victor Video 正在 观看 4Mbps 视频 ，Facebook Frank 每 20 秒 观 看 一 幅 新 的 100KB 图 片 ， 以 及 Mar- 
tha Music 正在 听 200kbps 音频 流 的 情况 ， 重 新 构造 9-1 Ko 

R2. 在 视频 中 有 两 种 类 型 的 元 余 。 描 述 它 们 ， 并 讨论 如 何 能 够 利用 它们 进行 有 效 压 缩 。 

R3. 假定 一 个 模拟 音频 信号 每 秒 抽样 16 000 x, 并且 每 个 样本 量化 为 1024 级 之 一 ,该 PCM 数字 音频 信 
号 的 比特 率 将 是 多 少 ? 

R4. 多 媒体 应 用 能 够 分 为 三 种 类 型 。 阐 述 它们 的 名 称 并 对 每 种 类 型 进行 描述 。 

9.2% 
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R6. 列举 UDP 流 的 三 种 缺点 。 

R7. 对 于 HTTP 流 ，TCP 接收 缓存 和 客户 应 用 缓存 是 相同 的 东西 吗 ? 如 果 不 是 ， 它 们 是 怎样 交互 的 呢 ? 

R8. 考虑 对 于 HTTP 流 的 简单 模型 。 假 设 服务 器 以 2Mbps 的 恒定 速率 发 送 比特 ， 并 且 当 已 经 接收 到 800 
万 比特 时 开始 播放 。 初 始 缓 存 时 延 t, 是 多 少 ? 

9.3 节 

RO. 端 到 端 时 延 和 分 组 时 延 拌 动 的 区 别 是 什么 ?分 组 时 延 拌 动 的 原因 是 什么 ? 

R10. 为 什么 在 预定 的 播放 时 间 之 后 收 到 的 分 组 被 认为 是 丢失 了 ? 

R11. 9.3 节 描 述 了 两 种 FEC 方案 ， 简 要 地 总 结 它 们 。 这 两 种 方案 通过 增加 开销 而 增加 了 流 的 传输 速率 。 

交织 技术 也 会 增加 传输 速率 吗 ? 

9.4 节 

R12. 接收 方 如 何 识别 在 不 同 会 话 中 的 不 同 RTP 流 ? 同一 个 会 话 中 的 不 同 流 是 怎样 识别 的 ? 

R13. SIP 注册 器 的 作用 是 什么 ? 一 个 SIP 注册 器 的 作用 与 移动 IP 中 的 归属 代理 的 作用 有 怎样 的 差异 ? 


EL 


Pl. 考虑 下 图 。 类 似 于 我 们 对 图 9-1 的 讨论 ， 假 设 视 频 以 固定 比特 率 进行 编码 ， 因 此 每 个 视频 块 包含 了 
在 相同 的 固定 时 间 量 A 播放 的 视频 帧 。 服 务 器 在 to 时 刻 传 输 第 一 个 视频 块 ， 在 i。+ A 时 刻 传 输 第 二 
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块 ,在 b+2A 时 刻 传输 第 三 块 ， 等 等 。 一 旦 客户 开始 播放 ， 每 个 块 应 当 在 前 一 块 后 播放 A 时 间 

单元 。 

a 假设 第 一 块 在 5 时 刻 一 到 达 ， 客 户 就 开始 播放 。 在 下 图 中 ， 多 少 视频 块 (包括 第 一 块 ) 将 及 时 到 
达 客 户 供 其 播放 ? 解释 你 怎样 得 到 该 答案 的 。 

b 假设 该 客户 现在 在 + A 时 刻 开始 播放 。 多 少 视 频 块 (包括 第 一 块 ) 将 及 时 到 达 客 户 供 其 播放 ? 
解释 你 怎样 得 到 该 答案 的 。 

c. 在 如 上 面 (b) 的 相同 场景 中 ， 存 储 在 客户 缓存 中 等 待 播放 的 块 的 最 大 数量 有 多 少 ? 解释 你 怎样 
得 到 该 答案 的 。 

d 在 客户 中 为 使 每 个 视频 块 及 时 到 达 供 其 播放 ，' 最 小 的 播放 时 延 是 多 少 ? 解释 你 怎样 得 到 该 答案 的 。 


视频 块 编号 








时 间 


. 回想 在 图 9-3 中 显示 的 HTTP 流 的 简单 模型 。 前 面 讲 过 B 表示 客户 应 用 缓存 的 长 度 ，0 表示 在 客户 应 
用 缓存 开始 播放 之 前 必须 被 缓存 的 比特 数量 。 还 有 r 表示 视频 消耗 速率 。 假 设 无 论 何 时 客户 缓存 不 
满 ， 服 务 器 都 以 恒定 速率 x 发 送 比特 。 

a 假设 x*<r。 如 在 本 书 所 讨论 ， 在 此 场合 播放 将 在 连续 播放 期 和 停滞 期 之 间 变动 。 作 为 0、r 和 x 的 
函数 ， 确 定 每 个 连续 播放 和 停滞 期 的 长 度 。 
b. 现在 假设 x>r。 求 客户 应 用 缓存 变 满 的 时 刻 t= 1,2 

. 回想 在 图 9-3 中 显示 的 HTTP 流 的 简单 模型 。 假 设 缓存 长 度 是 有 限 的 ， 并 服务 器 以 可 变 的 速率 x(1) 
发 送 比特 。 具 体 而 言 ， 假 设 x(t) 具有 下 列 锯齿 形状 。 其 速率 在 时 刻 ! = 0 初始 为 零 ， 在 时 刻 TR 
HIGHS 万。 然后 反复 重复 这 种 模式 ， 如 下 图 中 显示 的 那样 。 

a. 服务 器 的 平均 发 送 速 率 是 什么 ? 

b. 假设 0 =0， 客 户 一 接收 到 一 个 视频 块 就 开始 播放 。 将 发 生 什么 现象 ? 

c. 现在 假设 0 >0。 作 为 0、H 和 7 的 函数 ， 确 定 首先 开始 播放 的 时 间 。 

d. (RL H >2r 和 0 = HT/2。 证 明 在 初始 播放 时 延 之 后 将 不 会 有 停滞 。 

e. 假设 下 >2r。 求 出 最 小 的 0 值 ， 使 在 初始 播放 时 延 之 后 将 不 会 有 停滞 。 

f 现在 假定 缓存 长 度 B 是 有 限 的 。 假 定 媚 >2r。 作 为 0Q、B、7 和 世 的 函数 ， 确 定 当 客户 应 用 缓存 首 
次 变 满 的 时 刻 ! =, 


比特 率 x(t) 


P4. 
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回想 在 图 9-3 中 显示 的 HTTP 流 的 简单 模型 。 假 设 客户 应 用 缓存 长 度 是 有 限 的 ， 服 务 器 以 恒定 的 速率 
x 发 送 ， 并 且 视 频 的 压缩 率 是 r>， 其 中 r<x。 还 假设 播放 立即 开始 。 假 设 用 户 早 在 时 刻 上 = 无 中 止 视 
频 。 在 中 止 的 时 刻 ， 服 务 器 停止 发 送 比特 〈 如 果 它 还 没有 发 送 视频 中 所 有 上 比特 的 话 ) 。 

a. 假设 视频 为 有 限 长 。 问 浪费 了 多 少 比 特 〈 即 发 送 但 未 观看 )? 

b 假设 视频 为 了 秒 长 ， 其 中 了 >E。 问 浪费 了 多 少 比特 ( 即 发 送 但 未 观看 )? 


. 考虑 一 个 DASH 系统 ， 其 中 及 个 视频 版 本 (用 种 不 同 的 速率 和 质量 ) 入 种 音频 版 本 (有 NN 种 


不 同 的 速率 和 质量 ) 。 假 设 我 们 要 允许 播放 者 在 任何 时 间 对 任何 NN 种 视频 版 本 和 任何 N 种 音频 版 本 

进行 选择 。 

a. 如 果 我 们 生成 文件 ， 使 音频 与 视频 混合 起 来 ， 这 样 服务 器 在 给 定 的 时 间 仅 发 送 一 种 媒体 流 ， 该 服 
务 器 将 需要 存储 多 少 文件 〈 每 个 文件 有 一 种 不 同 的 URL)? 

b. 如 果 服 务 器 单独 发 送 音频 流 和 视频 流 并 且 让 客户 同步 这 些 流 的 话 ， 该 服务 器 将 需要 存储 多 少 文件 ? 


. 在 9.3 节 的 VoIP 例子 中 ,， 令 六 为 加 到 每 个 块 中 的 首部 字 节 总 数 ， 包 括 UDP A IP 的 首部 。 


a. 假设 每 20 秒 发 射 一 个 下 数据 报 ， 求 出 由 该 应 用 一 侧 产生 的 数据 报 的 每 秒 传输 速率 〈 以 比特 计 ) 。 
b. 当 使 用 RTP 时 ,hh 的 典型 值 是 什么 ? 


. 考虑 在 9.3 节 中 描述 估计 平均 时 延 d; 的 过 程 。 假 设 w=0.1。 $r -i 是 最 近 的 采样 时 延 ， 令 r -t 


是 下 一 个 最 近 的 采样 时 延 ， 等 等 。 

a_ 对 于 一 个 特定 的 音频 应 用 ， 假 设 四 个 分 组 到 达 接 收 方 的 采样 时 延 为 mm -tas ry tg. 7 — tp Mr, - 
tio REX 4 个 采样 来 表示 时 延 d 的 估计 值 。 

b. 对 于 个 采样 时 延 归纳 出 公式 。 

ce 对 于 b 小 题 的 公式 ， 令 于 趋 于 无 穷 ， 给 出 最 后 的 公式 。 评 论 一 下 为 什么 这 个 平均 过 程 被 称 为 一 个 
指数 移动 平均 数 。 

重复 习题 P7 中 的 (a) 和 (b) ， 求 出 平均 时 延 偏 差 的 估计 值 。 


. 对 于 9.3 节 中 的 VoIP 例子 ， 我们 引入 了 一 个 估计 时 延 的 在 线 过 程 〈 指 数 移动 平均 数 ) 。 在 本 习题 中 


我 们 将 研究 男 一 种 过 程 。 设 i; 是 接收 到 的 第 i 个 分 组 的 时 间 惟 ; BO, 是 收 到 第 i 个 分 组 的 时 间 。 令 d， 

表示 在 收 到 第 n 个 分 组 后 我 们 对 平均 时 延 的 估计 。 在 收 到 第 一 个 分 组 后 ,我 们 设置 时 延 估 计 值 等 于 

d, =7, =tio | 

a. (Ar TAH n, Ad, = (m -t +r -th + +r, -t,) /no TRH d,_,、r, Mt, 4h 
d, 的 递归 公式 。 

b. 描述 一 下 对 于 VoIP， 为 什么 在 9. 3 节 中 描述 的 时 延 估计 比 (a) 部 分 叙述 的 时 延 估计 更 合适 。 


P10. 比较 9. 3 节 描 述 的 估计 平均 时 延 的 过 程 和 3.5 节 估 计 往 返 时 间 的 过 程 。 这 些 过 程 有 什么 相同 ? 有 什 


么 不 同 ? 


Pll. 考虑 下 图 ( 它 类 似 于 图 9-3)。 某 发 送 方 在 1=1 时 开始 周期 性 地 发 送 分 组 化 的 音频 。 在 上 =8， 第 一 


个 分 组 到 达 接 收 方 。 


生成 的 分 组 一 


分 组 


收 到 的 分 组 一 


1 8 
时 间 


a. 分 组 2 到 分 组 8 的 时 延 (从 发 送 方 到 接收 方 ， 忽 略 任何 播放 时 延 ) 是 什么 ? 注意 到 在 该 图 上 每 个 
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P12. 


P13. 


P14. 


PIS. 


P16. 


FIs 


垂直 和 水 平 线段 具有 1、2 或 3 个 时 间 单 元 的 长 度 。 

b. 如 果 第 一 个 分 组 在 1=8 时 刻 一 到 达 接 收 方 ， 音 频 就 开始 播放 ， 发 送 的 前 8 个 分 组 中 的 哪些 将 不 
能 按时 到 达 进 行 播放 ? 

co 如 果 在 上 =9 时 刻 音频 开始 播放 ， 发 送 的 前 8 个 分 组 中 的 哪些 将 不 能 按时 到 达 进 行 播放 ? 

d. 在 接收 方 ， 导 致 所 有 前 8 个 分 组 按时 到 达 进 行 播放 的 最 小 播放 时 延 是 什么 ? 

再 次 考虑 习题 P11 中 的 图 ， 显 示 分 组 音频 传输 和 接收 时 间 。 

a. 计算 分 组 2 到 分 组 8 的 估计 时 延 ， 使 用 9. 3. 2 节 中 的 对 于 的 公式 。 使 用 w=0. 1 的 值 。 

b. 使 用 9. 3. 2 节 中 对 于 vw 的 公式 ， 从 对 分 组 2 到 分 组 8 的 估计 平均 时 延 计 算 其 估计 的 偏差 。 

在 9.3 节 中 讲 过 VoIP 的 两 种 FEC 方案 。 假 设 第 一 种 方案 为 每 4 个 初始 块 产生 一 个 元 余 块 。 假 设 第 

二 种 方案 使 用 传输 速率 为 标 称 流传 输 速率 的 25% 的 低 比特 率 编码 。 

a 每 种 方案 需要 多 少 额 外 带宽 ? 每 种 方案 增加 多 少 播放 时 延 ? 

b. 如 果 在 每 组 的 5 个 分 组 中 第 一 个 分 组 丢失 了 ， 这 两 种 方案 如 何 执行 ? 哪 一 种 方案 有 更 好 的 音频 
质量 ? 

c. 如 果 在 每 组 的 2 个 分 组 中 第 一 个 分 组 丢失 了 ， 这 两 种 方案 如 何 执行 ? 哪 一 种 方案 有 更 好 的 音频 
质量 ? 

a. 考虑 Skype 中 的 一 个 音频 会 议 具 有 N >2 个 与 会 者 。 假 定 每 个 与 会 者 生成 一 个 速率 rbps 的 恒定 流 。 
呼叫 的 发 起 方 将 需要 每 秒 发 送 多 少 比特 ?其 他 N -1 个 与 会 者 每 个 都 将 需要 每 秒 发 送 多 少 比 特 ? 
聚合 所 有 与 会 者 ， 总 的 发 送 速率 是 多 少 ? 

. 对 于 使 用 一 台中 心服 务 器 的 一 个 Skype 视频 会 议 ， 重复 (a), 

c. 重复 (b) ， 只 是 现在 情况 为 每 个 对 等 方 发 送 其 视频 流 副 本 到 其 他 N- 个 对 等 方 。 

a. 假设 我 们 向 因特网 发 送 两 个 IP 数据 报 ， 每 个 数据 报 携带 不 同 的 UDP 段 。 第 一 个 数据 报 的 源 卫 地 
址 为 Al1， 目的 人 地 址 为 B， 源 端口 为 Pl， 目 的 端口 为 T。 第 二 个 数据 报 的 源 IP 地 址 为 A2， 目 的 
IP 地 址 为 B， 源 端口 为 P22， 目的 端口 为 T。 假设 Al 和 A2 Ala], Pl Al P2 不同 。 假 设 这 两 个 数据 
报 都 到 达 它 们 的 目的 地 址 ， 这 两 个 UDP 数据 报 会 被 同一 个 套 接 字 接 收 吗 ? 为 什么 ? 

b. 假设 Alice, Bob 和 Claire 要 使 用 SIP 和 RTP 来 进行 音频 会 议 呼 叫 。Alice 与 Bob 和 Claire 之 间 发 送 
和 接收 RTP 分 组 ， 只 有 一 个 UDP 套 接 字 足够 吗 (SIP 报 文 所 需 的 套 接 字 除外 )? 如 果 够 ， 那 么 
Alice 的 SIP 客户 如 何 区 分 RTP 分 组 是 来 自 Bob 还 是 来 自 Claire? 

是 非 判 断 题 : 

a 如 果 存 储 视 频 直接 从 Web 服务 器 流 式 传 输 到 媒体 播放 器 ， 这 个 应 用 则 正在 使 用 TCP 作为 底层 的 
传输 协议 。 

b. 当 使 用 RTP 时 ， 发 送 方 有 可 能 在 会 话 的 中 间 改 变 编 码 。 

c. 所 有 使 用 RTP 的 应 用 必须 使 用 端口 87。 

d. 假设 一 个 RTP 会 话 对 每 个 发 送 方 有 独立 的 音频 和 视频 流 ， 则 这 些 音频 和 视频 流 使 用 同样 的 SSRC 。 

e. 在 区 分 服务 中 ， 尽 管 每 跳 行为 定义 了 各 类 型 之 间 的 性 能 差别 ， 但 它 没 有 强制 要 求 为 了 获得 这 些 性 
能 而 使 用 任何 特定 机 制 。 

f 假设 Alice 要 和 Bob 建立 一 个 SIP 会 话 。 在 她 的 INVITE 报 文 中 包括 了 这 样 的 行 : m = audio 48753 
RTP/AVP 3 (AVP 3 指示 GSM 音频 ) 。 因 此 Alice 在 该 报 文中 指示 她 要 发 送 CSM 音频 。 

g 参考 前 一 句 说 法 ，Alice 在 她 的 INVITE 报 文中 指示 了 她 将 把 音频 发 送 到 端口 48753 。 

h. SIP 报 文 在 SIP 实体 之 间 通 常 使 用 一 个 默认 的 SIP 端口 号 发 送 。 

i. 为 了 维护 注册 ，SIP 客户 必须 周期 地 发 送 REGISTER 报 文 。 

j. SIP 强制 所 有 的 SIP 客户 支持 G. 711 音频 编码 。 

考虑 下 图 ， 图 中 显示 了 一 个 由 分 组 流 提供 输入 的 漏 桶 监管 右 。 令 牌 桶 能 够 保持 最 多 两 个 令 牌 ， 并 最 

初 在 :=0 时 刻 是 满 的 。 新 的 令 牌 以 每 时 辽 1 个 令 牌 的 速率 到 达 。 输 出 链 路 速率 采用 下 列 规则 : 如 果 

两 个 分 组 在 一 个 时 隙 的 开始 获得 令 牌 它们 能 够 在 相同 的 时 际 中 进入 输出 链 路 。 该 系统 的 定时 细节 

如 下 : 


o- 
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uD 


盖 1 令 牌 /时 辽 
b=2 令 牌 


Ur 








分 组 队列 
(等 待 令 牌 ) 
1. 分 组 在 时 隙 的 开始 到 达 (如 果 有 的 话 ) 。 因 此 在 该 图 中 ， 分 组 1、2 和 3 在 时 际 0 到 达 。 如 果 在 队 
列 中 已 经 有 分 组 ， 则 到 达 的 分 组 加 入 该 队列 的 尾部 。 分 组 以 FIFO 方式 朝 着 该 队列 的 前 方 行进 。 
2. 当 到 达 分 组 增加 进 队 列 之 后 ， 如 果 有 任何 排队 分 组 ， 那 些 分 组 中 的 一 个 或 两 个 〈 取 决 于 可 用 令 牌 
的 数量 ) 将 每 个 从 令 牌 桶 中 去 除 一 个 令 牌 ， 并 在 那个 时 隙 去 往 输出 链 路 。 因 此 ， 分 组 1 和 2 从 桶 
中 去 除 一 个 令 牌 〈 因 为 最 初 有 两 个 令 牌 ) 并 在 时 际 0 期 间 去 往 输 出 链 路 。 
3. 如 果 令 牌 桶 未 满 则 新 令 牌 加 入 ， 因 为 令 牌 产生 速率 是 r=1 令 牌 /时 院 。 
4. 然后 时 间 前 进 到 下 一 个 时 隙 ， 并 且 重 复 这 些 步 又。 
回答 下 列 问题 : 
a. 对 每 个 时 隙 ， 在 到 达 分 组 处 理 后 (上 述 步 骤 1) 但 在 任何 分 组 通过 队列 传输 并 去 除 一 个 令 牌 之 前 
的 那个 时 刻 ， 指 出 位 于 队列 中 的 分 组 和 位 于 桶 中 的 令 牌 数量 。 因 此 ， 对 于 在 上 述 例子 中 的 上 =0 
时 刻 的 时 隙 ， 分 组 1、2 和 3 位 于 队列 中 ， 桶 中 有 两 个 令 牌 。 
b. 对 每 个 时 阶 ， 指 出 在 令 牌 从 队列 中 去 除 后 哪个 分 组 出 现在 输出 链 路 。 这 样 ， 对 于 上 述 例子 中 的 
t=0 WER, CEAT PEO 期 间 ， 分 组 1 和 2 从 漏 桶 出 现在 输出 链 路 上 。 
P18. 重复 习题 P17, 但 假设 r=2。 再 次 假设 初始 时 桶 是 满 的 。 
P19. 考虑 习题 P18 并 假设 现在 r=3 H b=2 与 以 前 一 样 。 你 对 上 述 问题 的 回答 有 变化 吗 ? 
P20. 考虑 一 下 监管 分 组 流 的 平均 速率 和 突 发 长 度 的 漏 桶 监管 器 。 我 们 现在 也 要 监管 峰值 速率 p。 说 明 这 
个 漏 桶 监管 器 的 输出 如 何 能 够 提供 给 第 二 个 漏 桶 监管 器 ， 使 得 这 两 个 串 行 的 漏 桶 能 够 监管 平均 速 
率 、 峰 值 速率 和 突 发 长 度 。 要 给 出 第 二 个 监管 器 的 桶 长 度 和 令 牌 产生 速率 。 
P21. 如 果 对 于 任何 上 来 说 ， 在 每 个 时 间 间 隔 长 度 上 内 到 达 漏 桶 的 分 组 数 小 于 rt +b 个， 那么 就 说 分 组 流 符 
合 一 个 突 发 长 度 b 和 平均 速率 7r 的 漏 桶 规范 (r,b)。 一 个 符合 漏 桶 规范 Cr, b) 的 分 组 流 必须 在 参 
数 r Alb 的 漏 桶 监管 器 那里 等 待 吗 ? 评估 你 的 答案 。 
P22. 说 明 只 要 7 <Rw,/( Zw), AA d. 实 际 上 是 流 1 中 任何 分 组 在 WFQ 队列 中 要 经 受 的 最 大 时 延 。 


É 编程 作业 


- -一 一 一 


在 这 个 实验 中 ， 将 实现 流 式 视频 服务 器 和 客户 。 该 客户 使 用 实时 流 协议 (RTSP) 来 控制 服务 器 的 动 
作 。 服 务 器 使 用 实时 协议 (RTP) 来 分 组 化 视频 以 便 在 UDP 上 传输 。 将 为 你 提供 在 客户 和 服务 器 中 部 分 
KIT RTSP Al RTP 的 Python 代码 ， 你 的 工作 是 完成 客户 和 服务 器 代码 。 当 完成 时 ， 你 将 已 经 创建 了 一 
个 进行 下 面 工作 的 客户 -服务 器 应 用 : 

e 客户 发 送 SETUP, PLAY, PAUSE 和 TEARDOWN 等 RTP 命令 ， 并 且 服 务 器 应 答 这 些 命 令 。 

© 当 服 务 器 处 于 播放 状态 ， 它 周期 地 抓 取 存储 的 JPEG ti, H RTP 对 该 帧 分 组 化 ， 并 将 该 RTP 分 组 

发 送 到 一 个 UDP 套 接 字 中 。 

© 客户 接收 该 RTP 分 组 ， 去 除 JPEG 帧 ， 解 压缩 该 帧 ， 并 在 客户 的 监管 器 上 再 现 该 帧 。 

为 你 提供 的 代码 在 服务 器 实现 RTSP 协议 ,在 客户 实现 对 RTP 解 分 组 化 。 这 个 代码 也 考虑 传输 视频 
的 显示 。 你 需要 在 客户 实现 RTSP 和 RTP 服务 器 。 该 编程 作业 将 极 大 地 增强 学 生 对 RTP, RTSP 和 流 式 视 
频 的 理解 。 我 们 极力 推荐 它 。 该 作业 也 建议 进行 大 量 可 选 的 练习 ， 包 括 在 客户 和 服务 器 实现 RTSP 的 
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DESCRIBE 命令 。 你 能 够 在 Web 站 点 http://www. pearsonhighered. com/cs- resources 找到 该 作业 的 全 部 细节 
以 及 RTSP 协议 的 概述 。 
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Henning Schulzrinne 是 哥伦比亚 大 学 的 教授 、 计 算 机 科学 系 的 主任 和 因 
特 网 实时 实验 室 的 负责 人 。 他 是 RTP、RTSP、SIP 和 GIST 这 些 音频 和 视频 经 
因特网 通信 的 关键 协议 的 作者 之 一 。Henning 在 德国 达 姆 施 塔 特工 业 大 学 
(TU Darmstadt) 获得 了 电气 工业 工程 学 士 学 位 ， 在 辛辛那提 大 学 获得 了 电气 
和 计算 机 工程 硕士 学 位 ， 以 及 在 马萨诸塞 大 学 阿 默 斯 特 学 院 获得 了 电气 工程 
博士 学 位 。 


© 是 什么 使 得 您 决定 致力 于 多 媒体 网 络 ? a Sh 

这 几乎 是 巧合 。 作 为 一 个 博士 生 ， 我 从 事 DARTnet 方面 的 工作 ，DARTnet 是 ei 
-NHT 线路 跨越 美国 的 实验 网 络 。DARTnet 用 于 为 多 播 和 因特网 实时 工具 提 Henning Schulzrinne 
供 场所 。 这 促使 我 写 了 我 的 第 一 个 音频 工具 NeVoT。 通 过 一 些 DARTnet 的 参与 者 ， 我 开始 参与 IETF 和 那 
时 新 成 立 的 音频 视频 传输 工作 组 的 工作 。 这 个 工作 组 后 来 完成 了 RTP 的 标准 化 。 

© 您 在 计算 机 行业 中 的 第 一 份 工 作 是 什么 ? 它 给 了 您 什么 收获 ? 

我 在 计算 机 行业 的 第 一 份 工 作 是 在 加 利 福 尼 亚 的 Livermore 读 高 中 时 焊接 一 个 牵 牛 星 (Altair) 计算 
机 工具 包 。 回 到 德国 ， 我 开 了 一 个 小 咨询 公司 来 给 旅行 社 设计 一 个 地 址 管理 程序 ， 为 我 们 的 TRS-80 开发 
了 将 数据 存储 在 磁带 上 的 功能 ， 并 通过 一 个 自己 制作 的 硬件 接口 把 IJBM 的 电动 打字 机 作为 打印 机 使 用 。 

我 第 一 份 真正 的 工作 是 在 AT&T 的 贝尔 实验 室 ， 为 在 实验 室 环境 下 构建 实验 网 络 而 研发 的 一 个 网 络 
仿真 器 。 

。 因特网 实时 实验 室 的 目的 是 什么 ? 

我 们 的 目的 是 为 因特网 作为 单一 的 未 来 通信 基础 设施 提供 组 件 和 构件 模块 。 这 包 插 开发 新 协议 ， 如 
GIST (用 于 网 络 层 信 令 ) 和 LoST (用 于 由 位 置 寻 找 资源 ) ， 或 通过 在 丰富 呈现 、 对 等 系统 、 下 一 代 紧 急 
情况 呼叫 和 服务 产生 工具 等 方面 的 工作 加 强 我 们 以 前 从 事 的 协议 ， 如 SIP。 最 近 ， 我 们 也 大 规模 地 研究 了 
用 于 VoIP 的 无 线 系 统 ， 因 为 802. 11b 和 802. 11n 网 络 以 及 也 许 WiMAX 网 络 有 可 能 成 为 用 于 电话 的 重要 
的 最 后 1 英里 技术 。 我 们 也 试图 使 用 一 种 称 为 DYSWIS (Do You See What I See， 你 所 见 即 我 所 见 ) 的 对 
等 方 到 对 等 方 故障 诊断 系统 ， 大 大 改进 用 户 在 面 对 提 供 商 和 设备 的 复杂 、 混 乱 问 题 时 的 故障 诊断 能 力 。 

通过 构建 原型 和 开放 源码 系统 、 测 量 实际 系统 的 性 能 ， 以 及 对 正 TF 标准 做 出 贡献 ， 我 们 试图 做 些 实 
践 性 相关 工作 。 

© 您 对 多 媒体 网 络 的 未 来 展望 是 什么 ? 

我 们 现在 正 处 于 一 种 过 渡 阶 段 ， 距 离 IP 成 为 从 IPTV 到 VoIP 等 多 媒体 服务 的 通用 平台 只 有 几 年 之 遥 
了 。 我 们 期 望 着 收音 机 、 电 话 和 电视 即使 在 暴风 十 和 地 震中 都 能 工作 ， 所 以 当 因 特 网 接替 了 这 些 专用 网 
络 的 职责 时 ， 用 户 将 期 待 有 同样 级 别 的 可 靠 性 。 

我 们 将 不 得 不 学 会 为 一 个 生态 系统 设计 网 络 技术 ， 该 生态 系统 包括 竞争 的 电信 公司 、 服 务 和 内 容 提 
供 商 ， 服 务 于 大 量 技术 上 未 受训 练 的 用 户 ， 并 保护 他 们 免 受 少 数 但 具有 破坏 性 的 一 批 恶意 和 犯罪 用 户 的 
侵害 。 改 变 协议 变 得 日 益 艰 难 。 协 议 也 变 得 更 为 复杂 ， 因 为 它们 需要 考虑 竞争 的 商业 利益 、 安 全 性 、 隐 
私 以 及 由 防火 墙 和 网 络 地 址 转换 引起 的 网 络 透 明 性 的 欠缺 。 

因为 多 媒体 网 络 正 在 成 为 几乎 所 有 消费 者 娱乐 的 基础 ， 因 此 以 低 成 本 管理 非常 大 的 网 络 将 成 为 重点 。 
用 户 将 期 待 易于 使 用 的 网 络 ， 例 如 可 以 在 所 有 的 设备 上 找到 相同 的 内 容 。 

e 为 什么 SIP 的 未 来 很 有 前 途 ? 

随 着 现在 的 无 线 网 络 正在 向 3G 网 络 升 级 ， 和 希望 单个 多 媒体 信 令 机 制 能 够 跨越 所 有 类 型 的 网 络 ， 包 
括 从 电缆 调制 解 调 器 到 企业 电话 网 和 公用 无 线 网 络 。 这 连同 软件 无 线 电 一 道 ， 在 将 来 使 下 列 东西 成 为 可 
能 : 单一 设备 能 被 用 于 家 庭 网 络 中 ， 能 被 作为 无 绳 蓝牙 电话 ， 用 于 经 802. 11 的 企业 网 中 和 经 3G 网 络 的 
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广域网 中 。 即 使 在 我 们 有 这 样 一 个 通用 的 无 线 设 备 之 前 ， 个 人 移动 机 制 使 得 隐藏 网 络 之 间 差 别 成 为 可 能 。 
一 个 标识 成 为 找到 一 个 人 的 通用 方法 ， 而 不 必 记 住 或 者 分 发 一 堆 特定 技术 或 特定 位 置 的 电话 号 码 。 

SIP 还 将 提供 语音 ( 比特 ) 传输 和 语音 服务 分 离 。 现 在 打破 本 地 电话 垄断 在 技术 上 已 成 为 可 能 ， 即 
一 个 公司 提供 中 性 的 比特 传输 ， 其 他 的 公司 提供 PP“ 拨号 音 ” 和 常用 的 电话 服务 ,例如 网 关 、 呼 叫 转移 
和 主 叫 者 ID. 

除了 多 媒体 信 令 ，SIP 提供 在 因特网 中 缺少 的 一 种 新 服务 : 事件 通知 。 我 们 已 经 有 了 这 种 具有 HTTP 
不 完善 系统 和 电子 邮件 功能 的 近似 服务 ,但 是 这 决 不 会 令 人 非常 满意 。 因 为 事件 是 对 分 布 式 系 统 的 通用 
抽象 ， 这 样 可 能 简化 新 服务 的 构建 。 

e 您 对 进入 网 络 领域 的 学 生 有 什么 忠告 吗 ? 

网 络 沟通 了 多 个 学 科 。 它 源 于 电子 工程 和 计算 机 科学 、 运 筹 学 、 经 济 学 和 其 他 学 科 的 所 有 方面 。 因 
此 ， 网 络 研 究 者 必须 熟悉 除了 协议 和 路 由 选择 算法 以 外 的 主题 。 

既然 网 络 已 经 成 为 日 常生 活 中 如 此 重要 的 一 部 分 ， 要 在 该 领域 标新立异 的 学 生 们 应 当 思考 网 络 中 新 
的 资源 限制 : 人 的 时 间 及 努力 ， 而 不 只 是 带宽 或 存储 。 

从 事 网 络 研究 工作 能 够 给 人 以 极 大 的 满足 ， 因 为 它 使 得 人 们 能 够 相互 通信 和 交换 思想 ， 这 是 人 类 所 
必需 的 。 因 特 网 服务 提供 商 已 经 成 为 第 三 大 全 球 性 基础 设施 ， 接 近 于 运输 系统 和 能 源 分 配 。 经 济 领域 几 
乎 没有 哪个 部 分 离开 高 性 能 网 络 还 能 正常 运转 ， 由 此 对 可 预测 的 将 来 应 当 有 大 量 机 会 。 
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